Google lanceert Gemini 2.0 en Anthropic rolt Claude 3.5 Haiku uit te midden van OpenAI's eindejaarsblitz

Like
vond

Datum:

Kopen Google Reviews ontketende Deze week wordt Gemini 2.0 gelanceerd, met zijn nieuwste AI-model vol autonome mogelijkheden en multimodale functies.

Wat direct opvalt in deze release, is dat Google AI-chatbots ziet evolueren naar AI-agenten: aangepaste software die generatieve AI gebruikt om met gebruikers te communiceren en taken in realtime te begrijpen en uit te voeren.

"Dankzij nieuwe ontwikkelingen op het gebied van multimodaliteit, zoals native beeld- en audio-uitvoer, en het gebruik van native tools, kunnen we nieuwe AI-agenten bouwen die ons dichter bij onze visie van een universele assistent brengen", aldus Google CEO Sundar Pichai.

Het model bouwt voort op de multimodale fundamenten van Gemini 1.5 met nieuwe native beeldgeneratie en tekst-naar-spraakmogelijkheden, naast verbeterde redeneervaardigheden.

Volgens Google presteert de 2.0 Flash-variant beter dan het vorige 1.5 Pro-model in belangrijke benchmarks en is hij twee keer zo snel.

Dit model is momenteel beschikbaar voor gebruikers die betalen voor Google Advanced, het betaalde abonnement dat is ontworpen om te concurreren met Claude en ChatGPT Plus.

Degenen die bereid zijn om hun handen vuil te maken, kunnen genieten van een completere ervaring door toegang te krijgen tot het model via Google AI Studio.

Vanaf daar kunnen gebruikers tot 1 miljoen contexttokens uploaden, bijna 10 keer de capaciteit van ChatGPT, samen met functies zoals ondersteuning voor audiovisuele invoer, feitencontrole met links, code-uitvoering en aanpasbare instellingen zoals 'temperatuur' voor willekeur van de respons en 'Top P' voor lexicale variatie, waardoor controle mogelijk is over de creativiteit of feitelijkheid van het model.

Het is belangrijk om te bedenken dat deze interface complexer is dan de eenvoudige, duidelijke en gebruiksvriendelijke gebruikersinterface van Gemini.

Het is ook krachtiger, maar veel langzamer. In onze tests vroegen we het om een ​​document van 74K token lang te analyseren, en het duurde bijna 10 minuten om een ​​reactie te produceren.

De output was echter accuraat genoeg, zonder hallucinaties. Langere documenten van ongeveer 200K tokens (bijna 150,000 woorden) zullen aanzienlijk langer duren om te analyseren, maar het model kan de klus klaren als je geduldig genoeg bent.

Google heeft ook een functie voor 'diepgaand onderzoek' geïmplementeerd, die nu beschikbaar is in Gemini Advanced. Hiermee wordt het verbeterde redeneringsvermogen en de mogelijkheden voor lange contexten van het model benut voor het onderzoeken van complexe onderwerpen en het samenstellen van rapporten.

Hiermee kunnen gebruikers verschillende onderwerpen diepgaander aanpakken dan ze zouden doen met een regulier model dat is ontworpen om eenvoudigere antwoorden te geven. Het is echter gebaseerd op Gemini 1.5 en er is geen tijdlijn om te volgen totdat er een versie is die is gebaseerd op Gemini 2.0.

Deze nieuwe functie plaatst Gemini in directe concurrentie met diensten zoals verwarring's Pro-zoekfunctie, jij.com's onderzoeksassistent, en zelfs de minder bekende BeaGo, die allemaal een vergelijkbare ervaring bieden. De service van Google biedt echter iets anders. Voordat informatie wordt verstrekt, moet de beste aanpak voor de taak worden uitgewerkt.

Het presenteert een plan aan de gebruiker, die het kan bewerken om informatie op te nemen of uit te sluiten, meer onderzoeksmateriaal toe te voegen of stukjes informatie te extraheren. Zodra de methodologie is ingesteld, kunnen ze de chatbot instrueren om met het onderzoek te beginnen. Tot nu toe bood geen enkele AI-service onderzoekers dit niveau van controle en aanpasbaarheid.

Bij onze tests leidde een simpele prompt als “Onderzoek de impact van AI op menselijke relaties” tot een onderzoek van meer dan een dozijn betrouwbare wetenschappelijke of officiële sites, waarbij het model een Document van 3 pagina's lang gebaseerd op 8 correct geciteerde bronnen. Helemaal niet slecht.

Project Astra: Gemini's multimodale AI-assistent

Google deelde ook een video waarin Project Astra werd getoond, zijn experimentele AI-assistent aangestuurd door Gemini 2.0. Astra is Google's antwoord op Meta-AI: Een AI-assistent die in realtime met mensen communiceert, waarbij de camera en microfoon van de smartphone worden gebruikt als invoer voor informatie en waarbij via spraakgestuurde communicatie wordt gereageerd.

Google heeft Project Astra uitgebreide mogelijkheden gegeven, waaronder meertalige gesprekken met verbeterde accentherkenning, integratie met Google Zoeken, Lens en Maps, een uitgebreid geheugen dat 10 minuten aan gesprekscontext behoudt, langetermijngeheugen en een lage gesprekslatentie via nieuwe streamingmogelijkheden.

Ondanks een lauwe ontvangst op sociale media—Google's video heeft sinds de lancering slechts 90 views gekregen: de release van de nieuwe familie modellen lijkt behoorlijk populair te worden onder gebruikers, met een aanzienlijke toename van het aantal zoekopdrachten op internet, vooral gezien het feit dat het werd aangekondigd tijdens een groot verduistering van ChatGPT Plus.

Uit de aankondiging van Google deze week blijkt duidelijk dat het bedrijf wil concurreren met OpenAI om marktleider te worden op het gebied van generatieve AI.

De aankondiging valt namelijk midden in de campagne “12 Days of Christmas” van OpenAI, waarin het bedrijf dagelijks een nieuw product onthult.

Tot nu toe heeft OpenAI een nieuw redeneermodel (o1), een videogeneratietool (Sora) en een maandelijks “Pro”-abonnement van $ 200 onthuld.

Google heeft ook zijn nieuwe door AI aangestuurde Chrome-extensie onthuld, Project Mariner, die agents gebruikt om door websites te navigeren en taken uit te voeren. Bij het testen tegen de WebVoyager-benchmark voor echte webtaken behaalde Mariner een succespercentage van 83.5% als een enkele agent, aldus Google.

"Het afgelopen jaar hebben we geïnvesteerd in de ontwikkeling van meer agentische modellen, wat betekent dat ze meer kunnen begrijpen over de wereld om je heen, meerdere stappen vooruit kunnen denken en namens jou actie kunnen ondernemen, onder jouw toezicht", schreef Pichai in de aankondiging.

Het bedrijf is van plan om Gemini 2.0-integratie uit te rollen in zijn hele productassortiment, te beginnen met experimentele toegang tot de Gemini-app vandaag. Een bredere release volgt in januari, inclusief integratie in de AI-functies van Google Search, die momenteel meer dan 1 miljard gebruikers bereiken.

Maar vergeet Claude niet

De release van Gemini 2 komt terwijl Anthropic in stilte zijn nieuwste update onthulde. Claude 3.5 Haiku is een snellere versie van zijn familie van AI-modellen die superieure prestaties claimt bij coderingstaken, met een score van 40.6% op de SWE-bench Verified benchmark.

Anthropic is nog steeds bezig met het ontwikkelen van zijn krachtigste model, Claude 3.5 Opus, dat na een reeks vertragingen later in 2025 uitgebracht zal worden.

Afbeelding: antropisch

De premiumdiensten van zowel Google als Anthropic kosten $ 20 per maand, wat overeenkomt met het basisabonnement ChatGPT Plus van OpenAI.

Claude 3.5 Haiku van Anthropic bleek veel sneller, goedkoper en krachtiger dan Claude 3 Sonnet (het middelgrote model van Anthropic uit de vorige generatie). De score bedroeg 88.1% bij HumanEval-codeertaken en 85.6% bij meertalige wiskundige problemen.

Het model toont met name zijn kracht op het gebied van gegevensverwerking. Bedrijven als Replit en Apollo melden aanzienlijke verbeteringen in de verfijning van de code en de generatie van inhoud.

Claude 3.5 Haiku is goedkoop bij $0.80 per miljoen tokens input.

Het bedrijf beweert dat gebruikers tot 90% kostenbesparingen kunnen behalen door snelle caching en een extra 50% reductie door gebruik te maken van de Message Batches API, wat het model positioneert als een kosteneffectieve optie voor ondernemingen die hun AI-activiteiten willen opschalen en een zeer interessante optie om te overwegen in vergelijking met OpenAI o1-mini, dat $ 3.00 per miljoen inputtokens.

Bewerkt door Sebastian Sinclair en Josh Quittner

Over het algemeen intelligent Nieuwsbrief

Een wekelijkse AI-reis verteld door Gen, een generatief AI-model.

Gerelateerde artikelen

spot_img

Recente artikelen

spot_img