USA – onsdag 11 december 2024
Google har presenterat Gemini 2.0, den senaste generationen av sin AI-modellfamilj, med funktioner som inte bara genererar text, bilder och tal utan också kan förstå och bearbeta multimodala indata som text, bilder, ljud och video. Lanseringen markerar en ny era för så kallad ”agentisk AI” som kan ta beslut och agera med användarens övervakning.
Gemini 2.0 Flash, en experimentell version av den nya familjen, finns nu tillgänglig för utvecklare via Gemini API, AI Studio och Vertex AI. Modellen har förbättrad prestanda och är dubbelt så snabb som tidigare versioner, enligt Google. Funktioner som bildgenerering och text-till-tal är dock begränsade till tidiga partners fram till januari 2025.
Funktioner och innovationer
Gemini 2.0 introducerar SynthID-vattenmärkning för ljud och bilder, vilket möjliggör identifiering av AI-genererat innehåll i stödda Google-produkter. Google satsar på att utveckla system som inte bara reagerar på användarens instruktioner, utan som även kan planera och agera flera steg framåt.
Flera nya projekt visar på modellens breda tillämpningsområden:
- Project Astra: En visuell AI-assistent för Android som nu kan hantera flera språk, använda Google Maps och komma ihåg samtal i upp till tio minuter.
- Project Mariner: Ett Chrome-tillägg som hjälper användare att slutföra uppgifter på webben genom att förstå innehållet på skärmen och interagera med webbläsarelement.
- Jules: En AI-agent som hjälper utvecklare i GitHub-arbetsflöden med planering och kodning.
- Multimodal Live API: Möjliggör applikationer med realtidsfunktioner för ljud och video samt stöd för naturliga konversationsmönster.
Framtidsvision
Google ser Gemini 2.0 som en viktig del av sin strategi att skapa AI-system som är mer delaktiga i användarens vardag. ”Vi är fortfarande i ett tidigt skede av utvecklingen,” säger Sundar Pichai, Googles VD. Företaget planerar att fortsätta förbättra modellen med större kapacitet och fler funktioner över tid.
Källa: Ars Technica
#AI #Google #Gemini2.0 #teknik #innovation