Google Gemini 1.5 kan använda hela filmer som datainmatning

Google har snabbt uppdaterat sin Gemini AI, tidigare känd som Google Bard, under de senaste månaderna. Idag avslöjade företaget en uppdaterad Gemini 1.5-modell som för närvarande testas, med möjligheten att bearbeta mer information på en gång och använda videor som input.

Google har avslöjat Gemini 1.5, en uppdaterad version av modellen som för närvarande driver Gemini chatbot och andra AI-funktioner och tjänster. Den är för närvarande endast tillgänglig i förhandsvisning för mjukvaruutvecklare och företagskunder, men den kommer förmodligen att rullas ut till Gemini chatbot inom en snar framtid.

Den främsta utlovade förbättringen är ett betydligt större “tokenkontextfönster”—data som kan vara indatainformation i AI-prompten. Gemini 1.5 Pro har ett standardkontextfönster på 128 000 token, ett betydande steg från gränsen på 32 000 token i Gemini 1.0. Google tillåter en begränsad grupp av utvecklare och företag att använda kontextfönster på upp till 1 miljon tokens, vilket räcker för en timmes video, 11 timmars ljud eller över 700 000 ord. Google sa att det också framgångsrikt testade en gräns på 10 miljoner tokens.

Google sa i ett blogginlägg, “[Gemini] 1.5 Pro kan utföra mycket sofistikerade förståelse- och resonemangsuppgifter för olika modaliteter, inklusive video. Till exempel, när den ges en 44-minuters tyst Buster Keaton-film, kan modellen noggrant analysera olika handlingspunkter och händelser, och till och med resonera om små detaljer i filmen som lätt kan missas."

Den uppdaterade Gemini-modellen är också förmodligen bättre på att "förstå och resonera uppgifter," överträffar den tidigare 1.0 Pro-modellen i 87 % av de riktmärken som Google använder för att testa stora språkmodeller. Det lämnar fortfarande utrymme för Gemini AI att skapa felaktig data, som alla andra generativa AI-lösningar, så det förblir en ofullständig lösning för dataanalys och fakta.

Google bekräftade inte när den vanliga chatboten Gemini och andra Google-tjänster kommer att uppdateras för att använda Gemini 1.5, men företaget sa att “avsevärda förbättringar av hastigheten också är i horisonten” ," så Google kanske väntar på det innan det rullar ut till alla användare. Den nya modellen är tillgänglig i förhandsvisning för utvecklare och företagskunder som använder AI Studio och Vertex AI.

Källa: Google

Google Gemini 1.5 kan använda hela filmer som datainmatning

Comments

Leave a Reply