Cosa succede quando le prestazioni dell’intelligenza artificiale sono asintotiche? Di @ttunguz

In passato, più grande era il modello AI, migliori erano le prestazioni. Nei modelli di OpenAI, ad esempio, i parametri sono cresciuti di oltre 1000 volte e le prestazioni sono quasi triplicate.

Modello OpenAI	Data di uscita	Parametri, B	MMLU
GPT2	2/14/19	1.5	0.324
GPT3	6/11/20	175	0.539
GPT3.5	3/15/22	175	0.7
GPT4	3/14/23	1760	0.864

Ma le prestazioni del modello saranno presto asintotiche, almeno su questo parametro.

Immagine

Questo è grafico delle prestazioni di molti recenti modelli di intelligenza artificiale secondo un benchmark ampiamente accettato chiamato MMLU. ¹ MMLU misura le prestazioni di un modello di intelligenza artificiale rispetto a uno studente delle scuole superiori.

Ho classificato i modelli in questo modo:

Grande: > 100 miliardi di parametri
Medio: parametri da 15 a 100b
Piccolo: < parametri 15b

Nel corso del tempo, le prestazioni stanno convergendo rapidamente sia tra le dimensioni dei modelli che tra i fornitori di modelli.

Cosa succede quando il modello open source di Facebook e il modello closed source di Google che alimenta Google.com e i modelli di OpenAI che alimenta ChatGPT funzionano tutti ugualmente bene?

Gli informatici sono stati sfidati a distinguere le prestazioni relative di questi modelli con molti test diversi. Gli utenti avranno difficoltà a fare di meglio.

A quel punto, il valore nel livello del modello dovrebbe crollare. Se un modello open source disponibile gratuitamente è valido quanto uno a pagamento, perché non utilizzare quello gratuito? E se un modello open source più piccolo e meno costoso da gestire è altrettanto valido, perché non utilizzarlo?

La rapida crescita dell’intelligenza artificiale ha alimentato un aumento di interesse per i modelli stessi. Ma abbastanza rapidamente, il livello infrastrutturale dovrebbe essere mercificato, proprio come è avvenuto nel cloud, dove tre fornitori detengono una quota di mercato del 65%: Amazon Web Services, Azure e Google Cloud Platform.

Le applicazioni e gli strumenti di sviluppo attorno ai massicci intermediari di materie prime basati sull'intelligenza artificiale rappresentano la fase successiva dello sviluppo, in cui la differenziazione e la distribuzione del prodotto si differenziano piuttosto che i progressi tecnici brillanti e grezzi.²

¹ MMLU misura 57 compiti diversi tra cui matematica, storia, informatica e altri argomenti. È una misura tra tante e non è perfetta, come qualsiasi benchmark. Ce ne sono altri, incluso il sistema Elo. Ecco un panoramica delle differenze.. Ciascun benchmark valuta il modello su uno spettro diverso: bias,
il ragionamento matematico sono altri due esempi.

Distribuzione di contenuti basati su SEO e PR. Ricevi amplificazione oggi.
PlatoData.Network Generativo verticale Ai. Potenzia te stesso. Accedi qui.
PlatoAiStream. Intelligenza Web3. Conoscenza amplificata. Accedi qui.
PlatoneESG. Carbonio, Tecnologia pulita, Energia, Ambiente, Solare, Gestione dei rifiuti. Accedi qui.
Platone Salute. Intelligence sulle biotecnologie e sulle sperimentazioni cliniche. Accedi qui.
Fonte: https://www.tomtunguz.com/what-happens-when-model-performance-asymptotes/

Intelligenza generativa dei dati

Cosa succede quando le prestazioni dell’intelligenza artificiale sono asintotiche? di @ttunguz

Codici del progetto Polaro per maggio 2024

Pacchetto Valorant Holomoku: data di rilascio prevista, skin e altro

L'ultima intelligenza

Classifiche di vendita nel Regno Unito: il successo indipendente Sea of Stars entra nella top 10 piena di Juggernauts

Codici delle razze animali per maggio 2024

I giocatori con valutazione 87 più economici in FC 24 Ultimate Team

Affrontare le sfide della sicurezza nelle piattaforme di comunicazione: approfondimenti da Interpillar

Le emozioni femminili di Inside Out 2 finalmente sembrano strane

Secondo quanto riferito, Meta è tornato alla sua parte di dispositivi indossabili: questa volta vuole attaccare le fotocamere agli auricolari per l'intelligenza artificiale