Logo Zephyrnet

Cosa succede quando le prestazioni dell’intelligenza artificiale sono asintotiche? di @ttunguz

Data:

In passato, più grande era il modello AI, migliori erano le prestazioni. Nei modelli di OpenAI, ad esempio, i parametri sono cresciuti di oltre 1000 volte e le prestazioni sono quasi triplicate.

Modello OpenAI Data di uscita Parametri, B MMLU
GPT2 2/14/19 1.5 0.324
GPT3 6/11/20 175 0.539
GPT3.5 3/15/22 175 0.7
GPT4 3/14/23 1760 0.864

Ma le prestazioni del modello saranno presto asintotiche, almeno su questo parametro.

Immagine

Questo è grafico delle prestazioni di molti recenti modelli di intelligenza artificiale secondo un benchmark ampiamente accettato chiamato MMLU. 1 MMLU misura le prestazioni di un modello di intelligenza artificiale rispetto a uno studente delle scuole superiori.

Ho classificato i modelli in questo modo:

  • Grande: > 100 miliardi di parametri
  • Medio: parametri da 15 a 100b
  • Piccolo: < parametri 15b

Nel corso del tempo, le prestazioni stanno convergendo rapidamente sia tra le dimensioni dei modelli che tra i fornitori di modelli.

Cosa succede quando il modello open source di Facebook e il modello closed source di Google che alimenta Google.com e i modelli di OpenAI che alimenta ChatGPT funzionano tutti ugualmente bene?

Gli informatici sono stati sfidati a distinguere le prestazioni relative di questi modelli con molti test diversi. Gli utenti avranno difficoltà a fare di meglio.

A quel punto, il valore nel livello del modello dovrebbe crollare. Se un modello open source disponibile gratuitamente è valido quanto uno a pagamento, perché non utilizzare quello gratuito? E se un modello open source più piccolo e meno costoso da gestire è altrettanto valido, perché non utilizzarlo?

La rapida crescita dell’intelligenza artificiale ha alimentato un aumento di interesse per i modelli stessi. Ma abbastanza rapidamente, il livello infrastrutturale dovrebbe essere mercificato, proprio come è avvenuto nel cloud, dove tre fornitori detengono una quota di mercato del 65%: Amazon Web Services, Azure e Google Cloud Platform.

Le applicazioni e gli strumenti di sviluppo attorno ai massicci intermediari di materie prime basati sull'intelligenza artificiale rappresentano la fase successiva dello sviluppo, in cui la differenziazione e la distribuzione del prodotto si differenziano piuttosto che i progressi tecnici brillanti e grezzi.2


1 MMLU misura 57 compiti diversi tra cui matematica, storia, informatica e altri argomenti. È una misura tra tante e non è perfetta, come qualsiasi benchmark. Ce ne sono altri, incluso il sistema Elo. Ecco un panoramica delle differenze.. Ciascun benchmark valuta il modello su uno spettro diverso: bias,
il ragionamento matematico sono altri due esempi.

spot_img

L'ultima intelligenza

spot_img