Zephyrnet-logo

ChatGPT versus Google Bard: een vergelijking van de technische verschillen

Datum:

ChatGPT versus Google Bard: een vergelijking van de technische verschillen
Afbeelding door auteur
 

Het grootste verschil tussen Google Bard en ChatGPT is dat Bard op het moment van schrijven op de hoogte is van ChatGPT, maar dat ChatGPT helemaal niet op de hoogte is van Bard. Maar ik kan spelen met ChatGPT, terwijl Google Bard voor de meesten van ons nog steeds buiten bereik is.

 

ChatGPT versus Google Bard: een vergelijking van de technische verschillen
Bron: Screenshot van ChatGPT

Zowel ChatGPT als Google Bard zijn AI-chatbots. De eenvoudigste versie van deze technologie bestaat al op uw smartphone: u typt 'Goed' en uw telefoon voorspelt dat het volgende woord dat u wilt gebruiken 'morgen' is.

ChatGPT is oorspronkelijk ontwikkeld door OpenAI en vervolgens geïnvesteerd door Microsoft voor een oogverblindende $10 miljard (naast een eerdere investering van $1 miljard). Google, enigszins in paniek dat hun zoekmonopolie misschien ten einde zou zijn, reageerde door Bard te onthullen, hun versie van de technologie met enkele gebreken. In zijn allereerste live demo, Bard meerdere feitelijke fouten gemaakt. Beschamend voor Google, op zijn zachtst gezegd.

ChatGPT en Google Bard zijn iets geavanceerder dan voorspellende tekst voor smartphones, maar om de verschillen tussen de twee AI-chatbots te begrijpen, is dat alles wat u moet weten om mee te beginnen.

Laten we de technische verschillen tussen deze twee AI-engines eens nader bekijken.

Je bent hier voor een snelle, gemakkelijke tabel om de technische verschillen tussen de twee motoren te krijgen. Hier is precies dat. Als je een meer genuanceerde look wilt, scrol dan gerust verder.

ChatGPT Bard
Model GPT-3.5 deMDA, of Taalmodel voor Dialoogtoepassingen
Neurale netwerkarchitectuur Transformator Transformator
Trainingsdata Webtekst, voornamelijk een dataset genaamd 'algemene crawl', wordt medio 2021 stopgezet 1.56 miljoen woorden openbare dialooggegevens en webtekst
Doel Een all-purpose chatbot voor het genereren van tekst zijn Specifiek om te helpen bij het zoeken
parameters 175 miljard parameters  137 miljard parameters
Schepper OpenAI Kopen Google Reviews
voordelen - Open nu voor iedereen

- Flexibeler en geschikt voor tekst met een open einde

– Trainingsgegevens stopgezet in 2021

- Trainingsgegevens tot heden

– Speciaal getraind voor dialoog, dus het klinkt menselijker als je het gebruikt om te spreken

Zwakke punten – Dialoog is niet zo overtuigend

– Niet zo zorgvuldig afgesteld

– Momenteel niet beschikbaar

– Mogelijk niet zo geschikt voor algemene tekstcreatie

Nu je de TL; DR hebt, laten we al deze statistieken eens nader bekijken.

ChatGPT kwam op 30 november 2022 op het toneel. Op 4 december 2022 was de service over een miljoen dagelijkse gebruikers. In januari 2023, dat aantal ballooned tot meer dan 100 miljoen gebruikers.

Het was meteen populair om de fundamentele reden dat het je solide antwoorden kon geven over een aantal onderwerpen op een manier die bijna menselijk klonk, en het was toegankelijk voor iedereen met een internetverbinding.

ChatGPT is gemaakt door OpenAI, een in San Francisco gevestigd AI-lab dat zich richt op het creëren van een vriendelijke AI. De chatbot zit op GPT-3.5, een groot taalmodel dat, wanneer tekst wordt gegeven, de prompt kan voortzetten.

ChatGPT kreeg bovendien wat extra training - menselijke trainers verbeterden het model door ermee te communiceren en 'belonden' het model voor antwoorden van hogere kwaliteit.

Trainingsdata

GPT-3.5 is getraind op een enorme dataset van webtekst, waaronder een populaire dataset genaamd Common Crawl. Common Crawl bevat petabytes aan webgegevens met onbewerkte webpaginagegevens, metadata-extracten en tekstextracten. Het omvat bijv. een verzameling van onze eigen URL's oppompen van StrataScratch. Is het niet gek om te denken dat ChatGPT is getraind met behulp van websites die we elke dag bezoeken?

Common Crawl was verantwoordelijk voor 60% van de trainingsgegevens, maar GPT-3.5 haalde ook gegevens uit andere bronnen.

 

ChatGPT versus Google Bard: een vergelijking van de technische verschillen
Bron: Wikipedia

bard is Het antwoord van Google aan de populariteit van ChatGPT. In tegenstelling tot ChatGPT wordt Bard mogelijk gemaakt door die van Google eigen model LaMDA, wat staat voor Language Model for Dialogue Applications. En in tegenstelling tot ChatGPT is het niet zo spannend om de simpele reden dat de meeste mensen er nog geen toegang toe hebben. Hoewel Google begin februari een met fouten beladen demo van Bard heeft gehost, is deze op dit moment alleen beschikbaar voor een select aantal mensen.

Het belangrijkste voordeel van Google's Bard is dat het open staat voor internet. Vraag ChatGPT wie de president is, en hij weet het niet. Dit komt doordat de opleidingsdata rond medio 2021 is afgesloten. Bard put ondertussen uit informatie op internet. Vraag het aan Bard, en in theorie zou Bard in staat moeten zijn om uit de gegevens die vandaag op internet beschikbaar zijn, te halen wie de president is.

Hoewel je er nog geen draai aan kunt geven, is het gemakkelijk te zien hoe Bard zich op een paar belangrijke punten onderscheidt van ChatGPT.

 

ChatGPT versus Google Bard: een vergelijking van de technische verschillen
Bron: die van Google blogpost over LaMDA

Trainingsdata

Ten eerste werd LaMDA getraind in dialoog, specifiek voor praten in conversatie, niet alleen voor het produceren van tekst zoals GPT-n-modellen zijn. Hoewel ChatGPT geen geheim maakt van zijn trainingsgegevens, weten we gewoon nog niet zo veel over de gegevens waarop Bard is getraind.

We kunnen een beetje extrapoleren door te kijken naar LaMDA's onderzoekspaper. De onderzoekers van Google zeiden dat 12.5% van de trainingsgegevens afkomstig was van Common Crawl, zoals GPT-n-modellen. Nog eens 12.5% komt van Wikipedia. En volgens de onderzoekspaper gebruikten ze 1.56 biljoen woorden aan 'openbare dialooggegevens en webtekst'.

Hier is het volledige overzicht:

12.5% op C4 gebaseerde gegevens (een afgeleide van Common Crawl-gegevens)
12.5% Engelstalige Wikipedia
12.5% codedocumenten van het programmeren van Q&A-websites, tutorials en andere
6.25% Engelse webdocumenten
6.25% Niet-Engelse webdocumenten
50% dialooggegevens van openbare forums

We kennen de Common Crawl-gegevens en u kent natuurlijk Wikipedia. De rest? Het is opzettelijk verborgen, vermoedelijk om Bard (en LaMDA) te beschermen tegen copycats.

LaMDA is gebouwd door het verfijnen van een familie van op Transformer gebaseerde neurale taalmodellen, die oorspronkelijk een open-source neurale netwerkarchitectuur zijn ontwikkeld door Google. (Leuke kanttekening: GPT is ook gebouwd op Transformer.)

 

ChatGPT versus Google Bard: een vergelijking van de technische verschillen
Bron: Google's blogpost over Bard
 

ChatGPT heeft een aantal vangrails om te voorkomen dat het te smerig wordt of complete onzin uitkraamt, maar Google heeft het gemaakt een echt punt om te benadrukken hoe ze zorgvuldig kwaliteitsgaranties hebben gecreëerd om van Bard een betere, veiligere chatbot te maken om te gebruiken. Bard is verfijnd om 'kwaliteit, geaardheid en veiligheid' te bevorderen.

Google heeft veel te zeggen hierover, en ik raad aan om hun blogpost erover te lezen, maar als je weinig tijd hebt, komt het eigenlijk hierop neer:

  • Bard moet antwoorden geven die logisch zijn - niets absurds, geen tegenstrijdigheden
  • Bard moet op een goede manier inzichtelijke, geestige of onverwachte antwoorden geven
  • Bard moet alles vermijden dat de gebruiker kan schaden - bloed, vooringenomenheid, haatdragende stereotypen om er maar een paar te noemen
  • Bard moet geen dingen verzinnen

Dankzij een foutieve lancering weten we al dat Google die onderste eis nog niet helemaal door heeft. Maar het is opmerkelijk dat Google zo duidelijk spreekt over deze ontwerpvereisten op een manier die ChatGPT nog niet heeft gedaan - althans nog niet.

ChatGPT heeft meer modelparameters dan Bard – 175 miljard tegenover 137 miljard. U kunt parameters zien als knoppen of hendels die het model aanpast aan de gegevens waarop het wordt getraind. Meer parameters betekenen over het algemeen dat het model meer capaciteit heeft om complexe relaties in taal vast te leggen, maar het loopt ook het risico van overfitting.

Google Bard is misschien minder flexibel, maar is mogelijk ook robuuster voor nieuwe taalgebruiksgevallen in vergelijking met ChatGPT.

Het is de moeite waard om te benadrukken dat zowel Bard als ChatGPT op modellen zitten (respectievelijk LaMDA en GPT-3.5) die op Op transformator gebaseerd diep lerende neurale netwerken.

Transformer kan een model maken dat is getraind om bijvoorbeeld een zin of alinea te lezen, aandacht te schenken aan hoe die woorden zich tot elkaar verhouden en vervolgens te voorspellen welke woorden volgens hem daarna zullen komen - vergelijkbaar met de voorspellende tekst van uw smartphone, zoals ik eerder al zei.

Ik zal hier niet te veel ingaan op het onkruid, maar alles wat je moet weten is dat dit betekent dat Bard en ChatGPT in wezen niet al te veel van elkaar verschillen.

Hoewel eigendom niet bepaald een technisch verschil is, is het de moeite waard om in gedachten te houden.

Google Bard wordt geproduceerd door en is volledig eigendom van Google, bovenop LaMDA, dat ook door Google is gemaakt.

ChatGPT is ontwikkeld door OpenAI, een in San Francisco gevestigd AI-onderzoekslaboratorium. OpenAI was oorspronkelijk een non-profitorganisatie, maar heeft in 2019 een dochteronderneming met winstoogmerk opgericht. OpenAI zat ook achter Dall-E, de AI-tekst-naar-afbeelding-generatie waarmee je misschien hebt gespeeld.

Hoewel Microsoft veel geld heeft geïnvesteerd in OpenAI, is het op dit moment een onafhankelijke onderzoeksorganisatie.

Het is moeilijk om een ​​eerlijk antwoord op deze vraag te geven, omdat ze allebei zo op elkaar lijken en toch zo verschillend zijn. Ten eerste heeft bijna niemand op dit moment toegang tot Google Bard. Aan de andere kant werden de trainingsgegevens van ChatGPT bijna twee jaar geleden afgesneden.

Beide zijn tekstgeneratoren - u biedt een prompt aan en zowel Google Bard als ChatGPT kunnen deze beantwoorden. Beide hebben miljarden parameters om het model te verfijnen. Beide hebben overlappende trainingsgegevensbronnen en beide zijn gebaseerd op Transformer, hetzelfde neurale netwerkmodel.

Ze zijn ook voor verschillende doeleinden ontworpen. Bard helpt u bij het navigeren door Google Zoeken. Het is ontworpen om gemoedelijk te zijn. ChatGPT kan hele blogposts genereren. Het is ontworpen om stukjes tekst uit te spugen die logisch zijn.

Uiteindelijk onderstrepen de technische verschillen tussen ChatGPT en Google Bard hoe ver AI-aangedreven technologie voor het genereren van tekst is gekomen. Hoewel ze allebei nog een weg te gaan hebben en beide te maken hebben gehad met controverse over auteursrecht en ethiek, zijn beide generatoren krachtige demonstraties van moderne AI-modellen.
 
 
Nate Rosidi is een datawetenschapper en in productstrategie. Hij is ook een adjunct-professor onderwijsanalyse en is de oprichter van StrataScratch, een platform dat datawetenschappers helpt bij het voorbereiden van hun interviews met echte interviewvragen van topbedrijven. Maak contact met hem op Twitter: StrataScratch or LinkedIn.
 

spot_img

Laatste intelligentie

spot_img