Logo Zephyrnet

ChatGPT vs Google Bard: un confronto delle differenze tecniche

Data:

ChatGPT vs Google Bard: un confronto delle differenze tecniche
Immagine dell'autore
 

La più grande differenza tra Google Bard e ChatGPT è che, al momento della stesura di questo documento, Bard conosce ChatGPT ma ChatGPT è beatamente all'oscuro di Bard. Ma posso giocare con ChatGPT, mentre Google Bard è ancora fuori portata per la maggior parte di noi.

 

ChatGPT vs Google Bard: un confronto delle differenze tecniche
Fonte: screenshot da ChatGPT

Sia ChatGPT che Google Bard sono chatbot AI. La versione più semplice di questa tecnologia esiste già sul tuo smartphone: digiti "Buono" e il tuo telefono prevede che la parola successiva che potresti voler usare è "mattina".

ChatGPT è stato originariamente sviluppato da OpenAI e poi investito da Microsoft per $ 10 miliardi (oltre a un precedente investimento di $ 1 miliardo). Google, in preda al panico per la fine del loro monopolio di ricerca, ha risposto svelando Bard, la loro versione della tecnologia con alcuni difetti. Nella sua primissima demo live, Bard commesso diversi errori di fatto. Imbarazzante per Google, per non dire altro.

ChatGPT e Google Bard sono un po' più sofisticati del testo predittivo per smartphone, ma per comprendere le differenze tra i due chatbot AI, è tutto ciò che devi sapere per iniziare.

Diamo uno sguardo più approfondito alle differenze tecniche tra questi due motori AI.

Sei qui per una tabella facile e veloce per ottenere le differenze tecniche tra i due motori. Ecco esattamente quello. Se vuoi un aspetto più sfumato, sentiti libero di scorrere ulteriormente.

ChatGPT Vate
Modello GPT-3.5 LAMDA, o modello linguistico per applicazioni di dialogo
Architettura della rete neurale trasformatore trasformatore
Dati di allenamento Testo Web, principalmente un set di dati chiamato "scansione comune", interrotto a metà del 2021 1.56 milioni di parole di dati di dialogo pubblico e testo web
Scopo Essere un chatbot per la generazione di testo per tutti gli usi In particolare per aiutare la ricerca
parametri 175 miliardi di parametri  137 miliardi di parametri
Creator OpenAI Google
Vantaggi – Aperto a tutti in questo momento

– Più flessibile e capace di testo aperto

– I dati sulla formazione tagliati al 2021

– Dati sull'allenamento fino ai giorni nostri

– Addestrato specificamente per il dialogo, quindi suona più umano quando lo usi per parlare

Punti di debolezza – Il dialogo non è così convincente

– Non così accuratamente messo a punto

– Al momento non disponibile

– Potrebbe non essere adatto alla creazione di testo generico

Ora che hai il TL; DR, diamo uno sguardo più approfondito a tutte queste metriche.

ChatGPT è entrato in scena il 30 novembre 2022. Entro il 4 dicembre 2022, il servizio era ancora un milione di utenti giornalieri. Nel gennaio 2023, quel numero gonfiato a oltre 100 milioni di utenti.

È stato subito popolare per il motivo fondamentale che poteva offrire risposte solide su una serie di argomenti in un modo che suonava quasi umano ed era accessibile a chiunque avesse una connessione Internet.

ChatGPT è stato creato da OpenAI, un laboratorio di intelligenza artificiale con sede a San Francisco che si concentra sulla creazione di un'IA amichevole. Il chatbot si trova su GPT-3.5, che è un modello di linguaggio di grandi dimensioni che, quando viene fornito del testo, può continuare il prompt.

ChatGPT ha ricevuto anche una formazione extra: i formatori umani hanno migliorato il modello interagendo con esso e "ricompensato" il modello per risposte di qualità superiore.

Dati di allenamento

GPT-3.5 è stato addestrato su un enorme set di dati di testo web, incluso un popolare set di dati chiamato Common Crawl. Common Crawl contiene petabyte di dati Web con dati non elaborati di pagine Web, estrazioni di metadati ed estrazioni di testo. Include, ad esempio, una raccolta dei nostri URL da Strata Scratch. Non è assurdo pensare che ChatGPT sia stato addestrato utilizzando i siti Web che visitiamo ogni giorno?

Common Crawl era responsabile del 60% dei dati di addestramento, ma GPT-3.5 riceveva dati anche da altre fonti.

 

ChatGPT vs Google Bard: un confronto delle differenze tecniche
Fonte: wikipedia

Bardo è La risposta di Google alla popolarità di ChatGPT. A differenza di ChatGPT, Bard è alimentato da Google proprio modello LaMDA, che è l'abbreviazione di Language Model for Dialogue Applications. E a differenza di ChatGPT, non è così eccitante per il semplice motivo che la maggior parte delle persone non può ancora accedervi. Sebbene Google abbia ospitato una demo di Bard carica di errori all'inizio di febbraio, al momento è disponibile solo per pochi eletti.

Il vantaggio principale di Bard di Google è che è aperto a Internet. Chiedi a ChatGPT chi è il presidente e non lo sa. Questo perché i dati di addestramento sono stati tagliati intorno alla metà del 2021. Bard, nel frattempo, attinge oggi alle informazioni su Internet. Chiedi a Bard e, in teoria, Bard dovrebbe essere in grado di estrarre dai dati disponibili oggi su Internet per dirti chi è il presidente.

Anche se non puoi ancora prenderlo per un giro, è facile vedere come Bard si distingue da ChatGPT in alcuni aspetti chiave.

 

ChatGPT vs Google Bard: un confronto delle differenze tecniche
Fonte: Google post sul blog su LaMDA

Dati di allenamento

Innanzitutto, LaMDA è stato addestrato al dialogo, in particolare per parlare durante una conversazione, non solo per produrre testo come lo sono i modelli GPT-n. Sebbene ChatGPT non faccia mistero dei suoi dati di addestramento, non sappiamo ancora molto sui dati su cui Bard è stato addestrato.

Possiamo estrapolare un po' guardando Il documento di ricerca di LaMDA. I ricercatori di Google hanno affermato che il 12.5% dei dati di addestramento proveniva da Common Crawl, come i modelli GPT-n. Un altro 12.5% proviene da Wikipedia. E secondo il documento di ricerca, hanno utilizzato 1.56 trilioni di parole di "dati di dialogo pubblico e testo web".

Ecco il dettaglio completo:

12.5% dati basati su C4 (un derivato dei dati Common Crawl)
12.5% Wikipedia in lingua inglese
12.5% documenti di codice da siti Web di domande e risposte sulla programmazione, tutorial e altri
6.25% documenti web in inglese
6.25% Documenti web non in inglese
Il 50% dei dialoghi dati dai forum pubblici

Conosciamo i dati di Common Crawl e ovviamente conosci Wikipedia. Il riposo? È intenzionalmente nascosto, presumibilmente per proteggere Bard (e LaMDA) dagli imitatori.

LaMDA è stato creato mettendo a punto una famiglia di modelli di linguaggio neurale basati su Transformer, che originariamente erano un'architettura di rete neurale open source sviluppato da Google. (Nota a margine divertente: anche GPT è basato su Transformer.)

 

ChatGPT vs Google Bard: un confronto delle differenze tecniche
Fonte: Post sul blog di Google su Bard
 

ChatGPT ha alcuni guardrail per evitare che diventi troppo sgradevole o che pronunci assurdità, ma Google ha creato un vero punto di evidenziare come hanno creato con cura garanzie di qualità per rendere Bard un chatbot migliore e più sicuro da usare. Bard è messo a punto per promuovere "qualità, radicamento e sicurezza".

Google ha molto da dire su questo, e consiglio di leggere il loro post sul blog a riguardo, ma se hai poco tempo, sostanzialmente si riduce a questo:

  • Bard dovrebbe dare risposte sensate: niente di assurdo, niente contraddizioni
  • Bard dovrebbe dare risposte perspicaci, spiritose o inaspettate in modo positivo
  • Bard dovrebbe evitare tutto ciò che rischia di danneggiare l'utente: sangue, pregiudizi, stereotipi odiosi per citarne alcuni
  • Bard non dovrebbe inventare cose

Grazie a un lancio difettoso, sappiamo già che Google non ha ancora capito il requisito minimo. Ma è degno di nota il fatto che Google parli così chiaramente di questi requisiti di progettazione in un modo che ChatGPT non ha fatto, almeno non ancora.

ChatGPT ha più parametri del modello rispetto a Bard: 175 miliardi contro 137 miliardi. Puoi pensare ai parametri come manopole o leve che il modello regola per adattarsi ai dati su cui viene addestrato. Più parametri in genere significano che il modello ha più capacità di catturare relazioni complesse nel linguaggio, ma corre anche il rischio di overfitting.

Google Bard potrebbe essere meno flessibile, ma potrebbe anche essere più robusto per i nuovi casi di utilizzo della lingua rispetto a ChatGPT.

Vale la pena sottolineare che sia Bard che ChatGPT siedono su modelli (rispettivamente LaMDA e GPT-3.5) che siedono su Basato su trasformatore reti neurali di apprendimento profondo.

Transformer può creare un modello addestrato a leggere una frase o un paragrafo, ad esempio, prestare attenzione a come quelle parole si relazionano tra loro e quindi prevedere quali parole pensa verranno dopo, in modo simile al testo predittivo del tuo smartphone, come ho menzionato prima.

Non entrerò troppo nelle erbacce qui, ma tutto ciò che devi sapere è che questo significa che, in fondo, Bard e ChatGPT non sono troppo diversi l'uno dall'altro.

Sebbene la proprietà non sia esattamente una differenza tecnica, vale la pena tenerla a mente.

Google Bard è prodotto e di proprietà interamente di Google, oltre a LaMDA, anch'esso creato da Google.

ChatGPT è sviluppato da OpenAI, un laboratorio di ricerca sull'intelligenza artificiale con sede a San Francisco. OpenAI era originariamente senza scopo di lucro, ma nel 2019 ha creato una filiale a scopo di lucro. OpenAI era anche dietro Dall-E, la generazione di testo in immagine AI con cui potresti aver giocato.

Sebbene Microsoft abbia investito molti soldi in OpenAI, per il momento è un'organizzazione di ricerca indipendente.

È difficile dare una risposta equa a questa domanda perché sono entrambi così simili, eppure così diversi. Per prima cosa, quasi nessuno può accedere a Google Bard in questo momento. Inoltre, i dati di addestramento di ChatGPT sono stati tagliati quasi due anni fa.

Entrambi sono generatori di testo: offri un prompt e sia Google Bard che ChatGPT possono rispondere. Entrambi hanno miliardi di parametri per mettere a punto il modello. Entrambi hanno origini dati di addestramento sovrapposte ed entrambi sono basati su Transformer, lo stesso modello di rete neurale.

Sono progettati anche per scopi diversi. Bard ti aiuterà a navigare nella ricerca di Google. È progettato per essere colloquiale. ChatGPT può generare interi post di blog. È progettato per sputare pezzi di testo che abbiano un senso.

In definitiva, le differenze tecniche tra ChatGPT e Google Bard sottolineano solo fino a che punto è arrivata la tecnologia di generazione di testo basata sull'intelligenza artificiale. Mentre entrambi hanno molta strada da fare, ed entrambi hanno affrontato controversie sul lato del copyright e dell'etica delle cose, entrambi i generatori sono potenti dimostrazioni dei moderni modelli di intelligenza artificiale.
 
 
Nato Rosidi è un data scientist e nella strategia di prodotto. È anche un professore a contratto che insegna analisi ed è il fondatore di Strata Scratch, una piattaforma che aiuta i data scientist a prepararsi per le loro interviste con domande di interviste reali delle migliori aziende. Connettiti con lui su Twitter: Strata Scratch or LinkedIn.
 

spot_img

L'ultima intelligenza

spot_img