Hallo Google, ik vertrouw er nog steeds niet op dat Gemini AI taken uitvoert

Belangrijkste punten

  • Google streeft ernaar generatieve AI te promoten als virtuele assistenten voor verschillende taken, maar de huidige technologie heeft beperkingen.
  • Google demonstreerde het gebruik van Gemini om biedingen van aannemers voor woningreparaties en andere taken te vergelijken.
  • Gemini en andere generatieve AI-tools hebben geen mensachtige redenering en logica.

Google had vandaag op Google I/O veel AI-functies om over te praten, die naar verluidt in staat waren tot alles, van het oplossen van wiskundige problemen tot het beheren van huisreparaties. Hoe vaker ik de presentatie bekeek, hoe meer ik me afvroeg: hoe kun je AI ooit vertrouwen voor deze taken?

De eerste golf van generatieve AI-chatbots en -modellen waren bijna volledig gericht op het ontleden en creëren van tekst. Je kunt ChatGPT vragen om een ​​persoonlijk gedicht te schrijven, of een klassieke fictieroman samen te vatten, of JavaScript- of C++-code te schrijven. Dat breidde zich ook uit naar verschillende mediaformaten, zoals afbeeldingen en video. Generatieve AI is nog steeds niet het perfecte hulpmiddel voor veel van deze gebruiksscenario’s, maar kan zeker nuttig zijn.

Google probeert generatieve AI nu te promoten als een completere virtuele assistent, die sommige taken kan uitvoeren met minimale of geen menselijke tussenkomst. Google Assistant, Siri en andere eerdere virtuele assistenten konden enkele basistaken uitvoeren, zoals het vinden van een nabijgelegen restaurant en het starten van navigatie-instructies. Google wil dat nog verder pushen met zijn Gemini AI-technologie, door taken over te nemen die normaal gesproken menselijk overzicht en logische verwerking vereisen.

Als samenvattingen fout gaan

Er waren veel demonstraties van AI-functies op het podium van Google I/O, maar belangrijker nog: de meeste daarvan waren vooraf opgenomen of gesimuleerd. Gemini heeft alle recente e-mails van een specifieke school in Gmail samengevat. Er werd ook een samenvatting van een vergadering gemaakt nadat de audio-opname van het gesprek was geparseerd. Dat zijn dezelfde gebruiksscenario's die Microsoft heeft gepromoot voor zijn Copilot-assistent, en hoewel de basissamenvatting minder stappen bevat die fout kunnen gaan, zou ik me nog steeds zorgen maken over het gebruik ervan voor belangrijke vergaderingen of berichten. Wat gebeurt er als Gemini de opmerkingen van je baas verkeerd hoort over welk project de prioriteit zou moeten hebben?

Google toonde ook zijn visie op ‘Agents’. die werden beschreven als door AI aangedreven helpers die ‘meerdere stappen vooruit kunnen denken’. en “werken met verschillende software en systemen.” Het eerste voorbeeld was het vragen aan Gemini om te helpen bij het retourneren van een online besteld paar schoenen: de AI vond het verzendlabel, nam contact op met Converse om de retourzending te starten en maakte een agenda-afspraak voor het ophalen van een pakket bij UPS. Een ander voorbeeld was de vraag aan Gemini: “Ik ben net naar Chicago verhuisd, waar moet ik aan denken?” Gemini stelde vervolgens voor om het adres van de gebruiker in verschillende services bij te werken, en het voltooide de taak na een eenvoudige bevestiging automatisch in hun DoorDash-account.

De demo die mij het meest schokte was een fragment over het gebruik van Gemini in Gmail. De persoon in het voorbeeld moet het dak van zijn huis laten repareren en vraagt ​​Gemini om de drie biedingen die naar zijn e-mailadres zijn verzonden, op te zoeken en samen te vatten. De persoon beslist welke aannemer hij moet kiezen, volledig op basis van de samenvatting, en stuurt vervolgens een antwoord-e-mail die ook door AI is gegenereerd.

Google

De reparatieoffertes in de voorbeeld-e-mail varieerden van $875 tot $1500. Als Gemini één detail fout heeft, of als er belangrijke informatie niet in de samenvatting is opgenomen, kan dat een zeer dure fout zijn. Ik kan me niet voorstellen dat ik ooit AI-hulp zal gebruiken om dat soort beslissingen te nemen. Ik zou in dezelfde situatie heel goed een fout kunnen maken, zoals het vergeten een bericht in een e-mailketen te lezen of cijfers door elkaar te halen, maar dan zou het tenminste mijn eigen schuld zijn. Hoe is Gemini een verbetering?

Google dekt de kosten van mijn kapotte dak niet omdat Gemini een e-mail verkeerd heeft gelezen. Ik krijg ook geen geld terug als mijn geretourneerde schoenen naar het verkeerde adres worden verzonden. Google heeft beloofd de juridische kosten te dekken wanneer zijn AI-tools onvermijdelijk inhoud creëren die te dicht in de buurt komt van auteursrechtelijk beschermd materiaal, maar dat is het dan ook.

Ik heb het afgelopen jaar generatieve AI-tools gebruikt om me te helpen met codeerwerk, of het schrijven van bash-scripts, of het converteren van gegevens tussen formaten. De sleutelzin daar is ‘help mij’. omdat ik nog steeds naar de invoer kijk en de resultaten controleer. Google wil steeds vaker dat generatieve AI taken volledig overneemt, en daar voel ik me niet prettig bij, gezien de huidige stand van de technologie.

Er zijn andere pogingen geweest om generatieve AI te gebruiken om echte taken uit te voeren. OpenTable was een van de eerste plug-ins voor ChatGPT, waarmee je mogelijk dinerreserveringen kunt boeken via de AI-chatbot. Er zijn een aantal meldingen dat dit niet werkt, hoewel het onduidelijk is of dit aan de AI of de onderliggende API-integraties te wijten is.

Vertrouw er niet op h2>

Google, en vele andere technologiebedrijven, willen u het idee verkopen dat generatieve AI logisch kan zijn en correcte beslissingen kan nemen op basis van voldoende informatie. Generatieve AI kan dat niet. Er bestaat momenteel geen AI die kan denken zoals jij, ik of enig ander mens. Dat is de reden waarom Gemini, ChatGPT, Copilot en elke andere AI-assistent programma's kunnen schrijven, maar nog steeds falen in fundamentele logische problemen. Gemini heeft vandaag een fout gemaakt in een demovideo bij Google I/O, en het is niet eens de eerste keer dat dit gebeurt.

Waarom zou ik erop vertrouwen dat Gemini belangrijke financiële beslissingen voor mij neemt, of enige andere echte taak? Is het besparen van een paar seconden of minuten met alledaagse taken echt de potentiële problemen waard? Het idee dat een chatbot die niet in staat is boter-kaas-en-eieren te spelen op de een of andere manier mijn leven zou kunnen automatiseren, is helemaal niet aantrekkelijk, hoe enthousiast Google er ook over is.


Posted

in

by

Tags:

Comments

Leave a Reply