Image par auteur
La plus grande différence entre Google Bard et ChatGPT est qu'au moment d'écrire ces lignes, Bard connaît ChatGPT mais ChatGPT ignore parfaitement Bard. Mais je peux jouer avec ChatGPT, alors que Google Bard est toujours hors de portée pour la plupart d'entre nous.
Source : Capture d'écran de ChatGPT
ChatGPT et Google Bard sont tous deux des chatbots IA. La version la plus simple de cette technologie existe déjà sur votre smartphone - vous tapez "Bien" et votre téléphone prédit que le prochain mot que vous voudrez peut-être utiliser est "matin".
ChatGPT a été développé à l'origine par OpenAI, puis investi par Microsoft pour 10 milliards de dollars (en plus d'un investissement antérieur de 1 milliard de dollars). Google, légèrement paniqué à l'idée que leur monopole de recherche pourrait toucher à sa fin, a répondu en dévoilant Bard, leur version de la technologie avec quelques défauts. Dans sa toute première démo live, Bard commis plusieurs erreurs factuelles. Embarrassant pour Google, c'est le moins qu'on puisse dire.
ChatGPT et Google Bard sont un peu plus sophistiqués que le texte prédictif pour smartphone, mais pour comprendre les différences entre les deux chatbots IA, c'est tout ce que vous devez savoir pour commencer.
Examinons plus en détail les différences techniques entre ces deux moteurs d'IA.
Vous êtes ici pour un tableau rapide et facile pour obtenir les différences techniques entre les deux moteurs. Voici exactement cela. Si vous voulez un look plus nuancé, n'hésitez pas à faire défiler plus loin.
ChatGPT | barde | |
Modèle | GPT-3.5 | LeMDA, ou modèle de langage pour les applications de dialogue |
Architecture de réseau neuronal | transformateur | transformateur |
Données d'entraînement | Texte Web, principalement un ensemble de données appelé "common crawl", coupé mi-2021 | 1.56 million de mots de données de dialogue public et de texte Web |
Objectif | Être un chatbot de génération de texte polyvalent | Spécifiquement pour aider à la recherche |
Paramètres | 175 milliards de paramètres | 137 milliards de paramètres |
Créateur | OpenAI | |
Avantages | – Ouvert à tous dès maintenant
– Plus flexible et capable de texte ouvert – Données de formation coupées à 2021 |
- Données d'entraînement jusqu'à aujourd'hui
– Formé spécifiquement pour le dialogue, il semble donc plus humain lorsque vous l'utilisez pour parler |
Points faibles | – Le dialogue n'est pas aussi convaincant
– Pas aussi soigneusement réglé |
– Non disponible actuellement
– Peut ne pas être aussi bien adapté à la création de texte générale |
Maintenant que vous avez le TL; DR, examinons plus en détail toutes ces mesures.
ChatGPT a fait irruption sur la scène le 30 novembre 2022. Le 4 décembre 2022, le service avait plus de un million d'utilisateurs quotidiens. En janvier 2023, ce nombre en ballon à plus de 100 millions d'utilisateurs.
Il a été immédiatement populaire pour la raison fondamentale qu'il pouvait vous offrir des réponses solides sur un certain nombre de sujets d'une manière qui semblait presque humaine, et il était accessible à toute personne disposant d'une connexion Internet.
ChatGPT a été créé par OpenAI, un laboratoire d'IA basé à San Francisco qui se concentre sur la création d'une IA conviviale. Le chatbot repose sur GPT-3.5, qui est un grand modèle de langage qui, lorsqu'il reçoit du texte, peut continuer l'invite.
ChatGPT a reçu une formation supplémentaire en plus de cela - des formateurs humains ont amélioré le modèle en interagissant avec lui et ont "récompensé" le modèle pour des réponses de meilleure qualité.
Données d'entraînement
GPT-3.5 a été formé sur un énorme ensemble de données de texte Web, y compris un ensemble de données populaire appelé Common Crawl. Common Crawl contient des pétaoctets de données Web avec des données de page Web brutes, des extraits de métadonnées et des extraits de texte. Il comprend, par exemple, une collection de nos propres URL de StrataScratch. N'est-il pas fou de penser que ChatGPT a été formé à l'aide de sites Web que nous visitons tous les jours ?
Common Crawl était responsable de 60 % des données d'entraînement, mais GPT-3.5 a également obtenu des données d'autres sources.
La source: Wikipédia
Barde est La réponse de Google à la popularité de ChatGPT. Contrairement à ChatGPT, Bard est optimisé par Google propre modèle LaMDA, qui est l'abréviation de Language Model for Dialogue Applications. Et contrairement à ChatGPT, ce n'est pas aussi excitant pour la simple raison que la plupart des gens ne peuvent pas encore y accéder. Bien que Google ait hébergé une démo chargée d'erreurs de Bard début février, elle n'est actuellement disponible que pour quelques privilégiés.
Le principal avantage de Google's Bard est qu'il est ouvert à Internet. Demandez à ChatGPT qui est le président, et il ne le sait pas. En effet, les données de formation ont été coupées vers la mi-2021. Bard, quant à lui, s'appuie aujourd'hui sur les informations d'internet. Demandez à Bard, et en théorie, Bard devrait pouvoir extraire des données disponibles sur Internet aujourd'hui pour vous dire qui est le président.
Bien que vous ne puissiez pas encore l'essayer, il est facile de voir comment Bard se démarque de ChatGPT à quelques égards clés.
Source : Google blog récents à propos de LaMDA
Données d'entraînement
Tout d'abord, LaMDA a été formé au dialogue, spécifiquement pour parler dans une conversation, pas seulement pour produire du texte comme le sont les modèles GPT-n. Bien que ChatGPT ne cache pas ses données de formation, nous ne savons tout simplement pas grand-chose – pour le moment – sur les données sur lesquelles Bard a été formé.
On peut extrapoler un peu en regardant Mémoire de recherche du LaMDA. Les chercheurs de Google ont déclaré que 12.5 % des données d'entraînement provenaient de Common Crawl, comme les modèles GPT-n. Un autre 12.5% provient de Wikipedia. Et selon le document de recherche, ils ont utilisé 1.56 billion de mots de "données de dialogue public et de texte Web".
Voici la répartition complète :
12.5 % de données basées sur C4 (un dérivé des données Common Crawl) |
12.5 % Wikipédia en anglais |
12.5 % codent des documents provenant de sites Web de questions-réponses sur la programmation, de didacticiels et autres |
6.25 % de documents Web en anglais |
6.25 % de documents Web dans une autre langue que l'anglais |
50 % de données de dialogue provenant de forums publics |
Nous connaissons les données de Common Crawl, et évidemment vous connaissez Wikipédia. Le reste? Il est intentionnellement caché, probablement pour protéger Bard (et LaMDA) des copieurs.
LaMDA a été construit en affinant une famille de modèles de langage neuronal basés sur Transformer, qui sont à l'origine une architecture de réseau neuronal open source développé par Google. (Remarque amusante - GPT est également construit sur Transformer.)
La source: Article de blog de Google sur Bard
ChatGPT a des garde-corps pour l'empêcher de devenir trop méchant ou de débiter des bêtises complètes, mais Google a fait un vrai point de souligner comment ils ont soigneusement créé des assurances qualité pour faire de Bard un chatbot meilleur et plus sûr à utiliser. Bard est affiné pour promouvoir "la qualité, l'enracinement et la sécurité".
Google a beaucoup à dire à ce sujet, et je vous recommande de lire leur article de blog à ce sujet, mais si vous manquez de temps, cela se résume essentiellement à ceci :
- Bard devrait donner des réponses qui ont du sens - rien d'absurde, pas de contradictions
- Le barde doit donner des réponses perspicaces, pleines d'esprit ou inattendues dans le bon sens
- Bard doit éviter tout ce qui risque de nuire à l'utilisateur - gore, préjugés, stéréotypes haineux pour n'en citer que quelques-uns
- Bard ne devrait pas inventer des trucs
Grâce à un lancement défectueux, nous savons déjà que Google n'a pas tout à fait compris cette exigence minimale. Mais il est à noter que Google parle si clairement de ces exigences de conception d'une manière que ChatGPT n'a tout simplement pas - du moins pas encore.
ChatGPT a plus de paramètres de modèle que Bard – 175 milliards contre 137 milliards. Vous pouvez considérer les paramètres comme des boutons ou des leviers que le modèle ajuste pour s'adapter aux données sur lesquelles il est formé. Plus de paramètres signifient généralement que le modèle a plus de capacité à capturer des relations complexes dans le langage, mais il court également le risque de surajustement.
Google Bard peut être moins flexible, mais peut également être plus robuste pour les nouveaux cas d'utilisation de la langue par rapport à ChatGPT.
Il convient de souligner que Bard et ChatGPT reposent sur des modèles (respectivement LaMDA et GPT-3.5) qui reposent sur Basé sur le transformateur réseaux de neurones d'apprentissage profond.
Transformer peut créer un modèle formé pour lire une phrase ou un paragraphe, par exemple, faire attention à la façon dont ces mots sont liés les uns aux autres, puis prédire les mots qui, selon lui, viendront ensuite - similaire au texte prédictif de votre smartphone, comme je l'ai mentionné plus tôt.
Je n'entrerai pas trop dans les mauvaises herbes ici, mais tout ce que vous devez savoir, c'est que cela signifie qu'à la base, Bard et ChatGPT ne sont pas trop différents l'un de l'autre.
Bien que la propriété ne soit pas exactement une différence technique, il convient de garder à l'esprit.
Google Bard est entièrement produit et détenu par Google, en plus de LaMDA, qui est également créé par Google.
ChatGPT est développé par OpenAI, un laboratoire de recherche sur l'IA basé à San Francisco. OpenAI était à l'origine à but non lucratif, mais il a créé une filiale à but lucratif en 2019. OpenAI était également derrière Dall-E, la génération de texte en image AI avec laquelle vous avez peut-être joué.
Alors que Microsoft a investi beaucoup d'argent dans OpenAI, il s'agit, pour le moment, d'un organisme de recherche indépendant.
Il est difficile de donner une réponse juste à cette question car ils sont tous les deux si similaires, mais si différents. D'une part, presque personne ne peut accéder à Google Bard pour le moment. D'autre part, les données de formation de ChatGPT ont été supprimées il y a près de deux ans.
Les deux sont des générateurs de texte - vous proposez une invite, et Google Bard et ChatGPT peuvent y répondre. Les deux ont des milliards de paramètres pour affiner le modèle. Les deux ont des sources de données de formation qui se chevauchent, et les deux sont construits sur Transformer, le même modèle de réseau neuronal.
Ils sont également conçus à des fins différentes. Bard vous aidera à naviguer dans la recherche Google. Il est conçu pour être conversationnel. ChatGPT peut générer des articles de blog entiers. Il est conçu pour cracher des morceaux de texte qui ont du sens.
En fin de compte, les différences techniques entre ChatGPT et Google Bard ne font que souligner le chemin parcouru par la technologie de génération de texte basée sur l'IA. Bien qu'ils aient tous deux du chemin à faire et qu'ils aient tous deux fait face à une controverse sur le droit d'auteur et l'éthique, les deux générateurs sont de puissantes démonstrations des modèles d'IA modernes.
Nate Rosidi est data scientist et en stratégie produit. Il est également professeur adjoint enseignant l'analytique et fondateur de StrataScratch, une plate-forme aidant les data scientists à préparer leurs entretiens avec de vraies questions d'entretien posées par les meilleures entreprises. Connectez-vous avec lui sur Twitter : StrataScratch or LinkedIn.
- Contenu propulsé par le référencement et distribution de relations publiques. Soyez amplifié aujourd'hui.
- Platoblockchain. Intelligence métaverse Web3. Connaissance Amplifiée. Accéder ici.
- La source: https://www.kdnuggets.com/2023/03/chatgpt-google-bard-comparison-technical-differences.html?utm_source=rss&utm_medium=rss&utm_campaign=chatgpt-vs-google-bard-a-comparison-of-the-technical-differences