Logo Zéphyrnet

ChatGPT vs Google Bard : une comparaison des différences techniques

Date :

ChatGPT vs Google Bard : une comparaison des différences techniques
Image par auteur
 

La plus grande différence entre Google Bard et ChatGPT est qu'au moment d'écrire ces lignes, Bard connaît ChatGPT mais ChatGPT ignore parfaitement Bard. Mais je peux jouer avec ChatGPT, alors que Google Bard est toujours hors de portée pour la plupart d'entre nous.

 

ChatGPT vs Google Bard : une comparaison des différences techniques
Source : Capture d'écran de ChatGPT

ChatGPT et Google Bard sont tous deux des chatbots IA. La version la plus simple de cette technologie existe déjà sur votre smartphone - vous tapez "Bien" et votre téléphone prédit que le prochain mot que vous voudrez peut-être utiliser est "matin".

ChatGPT a été développé à l'origine par OpenAI, puis investi par Microsoft pour 10 milliards de dollars (en plus d'un investissement antérieur de 1 milliard de dollars). Google, légèrement paniqué à l'idée que leur monopole de recherche pourrait toucher à sa fin, a répondu en dévoilant Bard, leur version de la technologie avec quelques défauts. Dans sa toute première démo live, Bard commis plusieurs erreurs factuelles. Embarrassant pour Google, c'est le moins qu'on puisse dire.

ChatGPT et Google Bard sont un peu plus sophistiqués que le texte prédictif pour smartphone, mais pour comprendre les différences entre les deux chatbots IA, c'est tout ce que vous devez savoir pour commencer.

Examinons plus en détail les différences techniques entre ces deux moteurs d'IA.

Vous êtes ici pour un tableau rapide et facile pour obtenir les différences techniques entre les deux moteurs. Voici exactement cela. Si vous voulez un look plus nuancé, n'hésitez pas à faire défiler plus loin.

ChatGPT barde
Modèle GPT-3.5 LeMDA, ou modèle de langage pour les applications de dialogue
Architecture de réseau neuronal transformateur transformateur
Données d'entraînement Texte Web, principalement un ensemble de données appelé "common crawl", coupé mi-2021 1.56 million de mots de données de dialogue public et de texte Web
Objectif Être un chatbot de génération de texte polyvalent Spécifiquement pour aider à la recherche
Paramètres 175 milliards de paramètres  137 milliards de paramètres
Créateur OpenAI Google
Avantages – Ouvert à tous dès maintenant

– Plus flexible et capable de texte ouvert

– Données de formation coupées à 2021

- Données d'entraînement jusqu'à aujourd'hui

– Formé spécifiquement pour le dialogue, il semble donc plus humain lorsque vous l'utilisez pour parler

Points faibles – Le dialogue n'est pas aussi convaincant

– Pas aussi soigneusement réglé

– Non disponible actuellement

– Peut ne pas être aussi bien adapté à la création de texte générale

Maintenant que vous avez le TL; DR, examinons plus en détail toutes ces mesures.

ChatGPT a fait irruption sur la scène le 30 novembre 2022. Le 4 décembre 2022, le service avait plus de un million d'utilisateurs quotidiens. En janvier 2023, ce nombre en ballon à plus de 100 millions d'utilisateurs.

Il a été immédiatement populaire pour la raison fondamentale qu'il pouvait vous offrir des réponses solides sur un certain nombre de sujets d'une manière qui semblait presque humaine, et il était accessible à toute personne disposant d'une connexion Internet.

ChatGPT a été créé par OpenAI, un laboratoire d'IA basé à San Francisco qui se concentre sur la création d'une IA conviviale. Le chatbot repose sur GPT-3.5, qui est un grand modèle de langage qui, lorsqu'il reçoit du texte, peut continuer l'invite.

ChatGPT a reçu une formation supplémentaire en plus de cela - des formateurs humains ont amélioré le modèle en interagissant avec lui et ont "récompensé" le modèle pour des réponses de meilleure qualité.

Données d'entraînement

GPT-3.5 a été formé sur un énorme ensemble de données de texte Web, y compris un ensemble de données populaire appelé Common Crawl. Common Crawl contient des pétaoctets de données Web avec des données de page Web brutes, des extraits de métadonnées et des extraits de texte. Il comprend, par exemple, une collection de nos propres URL de StrataScratch. N'est-il pas fou de penser que ChatGPT a été formé à l'aide de sites Web que nous visitons tous les jours ?

Common Crawl était responsable de 60 % des données d'entraînement, mais GPT-3.5 a également obtenu des données d'autres sources.

 

ChatGPT vs Google Bard : une comparaison des différences techniques
La source: Wikipédia

Barde est La réponse de Google à la popularité de ChatGPT. Contrairement à ChatGPT, Bard est optimisé par Google propre modèle LaMDA, qui est l'abréviation de Language Model for Dialogue Applications. Et contrairement à ChatGPT, ce n'est pas aussi excitant pour la simple raison que la plupart des gens ne peuvent pas encore y accéder. Bien que Google ait hébergé une démo chargée d'erreurs de Bard début février, elle n'est actuellement disponible que pour quelques privilégiés.

Le principal avantage de Google's Bard est qu'il est ouvert à Internet. Demandez à ChatGPT qui est le président, et il ne le sait pas. En effet, les données de formation ont été coupées vers la mi-2021. Bard, quant à lui, s'appuie aujourd'hui sur les informations d'internet. Demandez à Bard, et en théorie, Bard devrait pouvoir extraire des données disponibles sur Internet aujourd'hui pour vous dire qui est le président.

Bien que vous ne puissiez pas encore l'essayer, il est facile de voir comment Bard se démarque de ChatGPT à quelques égards clés.

 

ChatGPT vs Google Bard : une comparaison des différences techniques
Source : Google blog récents à propos de LaMDA

Données d'entraînement

Tout d'abord, LaMDA a été formé au dialogue, spécifiquement pour parler dans une conversation, pas seulement pour produire du texte comme le sont les modèles GPT-n. Bien que ChatGPT ne cache pas ses données de formation, nous ne savons tout simplement pas grand-chose – pour le moment – ​​sur les données sur lesquelles Bard a été formé.

On peut extrapoler un peu en regardant Mémoire de recherche du LaMDA. Les chercheurs de Google ont déclaré que 12.5 % des données d'entraînement provenaient de Common Crawl, comme les modèles GPT-n. Un autre 12.5% provient de Wikipedia. Et selon le document de recherche, ils ont utilisé 1.56 billion de mots de "données de dialogue public et de texte Web".

Voici la répartition complète :

12.5 % de données basées sur C4 (un dérivé des données Common Crawl)
12.5 % Wikipédia en anglais
12.5 % codent des documents provenant de sites Web de questions-réponses sur la programmation, de didacticiels et autres
6.25 % de documents Web en anglais
6.25 % de documents Web dans une autre langue que l'anglais
50 % de données de dialogue provenant de forums publics

Nous connaissons les données de Common Crawl, et évidemment vous connaissez Wikipédia. Le reste? Il est intentionnellement caché, probablement pour protéger Bard (et LaMDA) des copieurs.

LaMDA a été construit en affinant une famille de modèles de langage neuronal basés sur Transformer, qui sont à l'origine une architecture de réseau neuronal open source développé par Google. (Remarque amusante - GPT est également construit sur Transformer.)

 

ChatGPT vs Google Bard : une comparaison des différences techniques
La source: Article de blog de Google sur Bard
 

ChatGPT a des garde-corps pour l'empêcher de devenir trop méchant ou de débiter des bêtises complètes, mais Google a fait un vrai point de souligner comment ils ont soigneusement créé des assurances qualité pour faire de Bard un chatbot meilleur et plus sûr à utiliser. Bard est affiné pour promouvoir "la qualité, l'enracinement et la sécurité".

Google a beaucoup à dire à ce sujet, et je vous recommande de lire leur article de blog à ce sujet, mais si vous manquez de temps, cela se résume essentiellement à ceci :

  • Bard devrait donner des réponses qui ont du sens - rien d'absurde, pas de contradictions
  • Le barde doit donner des réponses perspicaces, pleines d'esprit ou inattendues dans le bon sens
  • Bard doit éviter tout ce qui risque de nuire à l'utilisateur - gore, préjugés, stéréotypes haineux pour n'en citer que quelques-uns
  • Bard ne devrait pas inventer des trucs

Grâce à un lancement défectueux, nous savons déjà que Google n'a pas tout à fait compris cette exigence minimale. Mais il est à noter que Google parle si clairement de ces exigences de conception d'une manière que ChatGPT n'a tout simplement pas - du moins pas encore.

ChatGPT a plus de paramètres de modèle que Bard – 175 milliards contre 137 milliards. Vous pouvez considérer les paramètres comme des boutons ou des leviers que le modèle ajuste pour s'adapter aux données sur lesquelles il est formé. Plus de paramètres signifient généralement que le modèle a plus de capacité à capturer des relations complexes dans le langage, mais il court également le risque de surajustement.

Google Bard peut être moins flexible, mais peut également être plus robuste pour les nouveaux cas d'utilisation de la langue par rapport à ChatGPT.

Il convient de souligner que Bard et ChatGPT reposent sur des modèles (respectivement LaMDA et GPT-3.5) qui reposent sur Basé sur le transformateur réseaux de neurones d'apprentissage profond.

Transformer peut créer un modèle formé pour lire une phrase ou un paragraphe, par exemple, faire attention à la façon dont ces mots sont liés les uns aux autres, puis prédire les mots qui, selon lui, viendront ensuite - similaire au texte prédictif de votre smartphone, comme je l'ai mentionné plus tôt.

Je n'entrerai pas trop dans les mauvaises herbes ici, mais tout ce que vous devez savoir, c'est que cela signifie qu'à la base, Bard et ChatGPT ne sont pas trop différents l'un de l'autre.

Bien que la propriété ne soit pas exactement une différence technique, il convient de garder à l'esprit.

Google Bard est entièrement produit et détenu par Google, en plus de LaMDA, qui est également créé par Google.

ChatGPT est développé par OpenAI, un laboratoire de recherche sur l'IA basé à San Francisco. OpenAI était à l'origine à but non lucratif, mais il a créé une filiale à but lucratif en 2019. OpenAI était également derrière Dall-E, la génération de texte en image AI avec laquelle vous avez peut-être joué.

Alors que Microsoft a investi beaucoup d'argent dans OpenAI, il s'agit, pour le moment, d'un organisme de recherche indépendant.

Il est difficile de donner une réponse juste à cette question car ils sont tous les deux si similaires, mais si différents. D'une part, presque personne ne peut accéder à Google Bard pour le moment. D'autre part, les données de formation de ChatGPT ont été supprimées il y a près de deux ans.

Les deux sont des générateurs de texte - vous proposez une invite, et Google Bard et ChatGPT peuvent y répondre. Les deux ont des milliards de paramètres pour affiner le modèle. Les deux ont des sources de données de formation qui se chevauchent, et les deux sont construits sur Transformer, le même modèle de réseau neuronal.

Ils sont également conçus à des fins différentes. Bard vous aidera à naviguer dans la recherche Google. Il est conçu pour être conversationnel. ChatGPT peut générer des articles de blog entiers. Il est conçu pour cracher des morceaux de texte qui ont du sens.

En fin de compte, les différences techniques entre ChatGPT et Google Bard ne font que souligner le chemin parcouru par la technologie de génération de texte basée sur l'IA. Bien qu'ils aient tous deux du chemin à faire et qu'ils aient tous deux fait face à une controverse sur le droit d'auteur et l'éthique, les deux générateurs sont de puissantes démonstrations des modèles d'IA modernes.
 
 
Nate Rosidi est data scientist et en stratégie produit. Il est également professeur adjoint enseignant l'analytique et fondateur de StrataScratch, une plate-forme aidant les data scientists à préparer leurs entretiens avec de vraies questions d'entretien posées par les meilleures entreprises. Connectez-vous avec lui sur Twitter : StrataScratch or LinkedIn.
 

spot_img

Dernières informations

spot_img