Logo Zephyrnet

Riepilogo delle promesse e delle insidie ​​– Prima parte » Blog CCC

Data:

CCC ha sostenuto tre sessioni scientifiche alla conferenza annuale dell'AAAS di quest'anno e, nel caso in cui non potessi partecipare di persona, ricapitoleremo ciascuna sessione. Questa settimana riassumeremo i punti salienti della sessione: “L'intelligenza artificiale generativa nella scienza: promesse e insidie.” Nella prima parte riassumeremo l'introduzione e la presentazione della Dott.ssa Rebecca Willett.

Il primo panel AAAS di CCC della riunione annuale del 2024 si è svolto venerdì 16 febbraio, il secondo giorno della conferenza. Il panel, moderato dallo stesso CCC Dottor Matthew Turk, presidente del Toyota Technological Institute di Chicago, era composto da esperti che applicano l'intelligenza artificiale a una varietà di campi scientifici. La dottoressa Rebecca Willett, professoressa di statistica e informatica all'Università di Chicago, ha concentrato la sua presentazione su come i modelli generativi possono essere utilizzati nelle scienze e sul perché i modelli standard non sono sufficienti per essere applicati alla ricerca scientifica. Dott. Markus Buehler, professore di ingegneria al Massachusetts Institute of Technology, ha parlato di modelli generativi applicati alla scienza dei materiali, e Dottor Duncan Watson-Parris, professore assistente presso lo Scripps Institution of Oceanography e l'Halıcıoğlu Data Science Institute presso l'UC San Diego, hanno discusso come i modelli generativi possano essere utilizzati nello studio delle scienze climatiche.

Il dottor Turk, esperto di visione artificiale e interazione uomo-computer, ha iniziato il panel distinguendo l’intelligenza artificiale generativa da tutta l’intelligenza artificiale. "Al centro delle applicazioni di intelligenza artificiale generativa ci sono modelli generativi composti da reti neurali profonde che apprendono la struttura dei loro voluminosi dati di addestramento e quindi generano nuovi dati in base a ciò che hanno imparato."

Il Dr. Turk ha anche sottolineato le preoccupazioni diffuse nei confronti dei sistemi generativi, sia a causa di fallimenti dei sistemi stessi, come quelli che citano memorie legali inesistenti, sia a causa del loro utilizzo da parte di malintenzionati per generare contenuti falsi, come quello di audio falso o video di politici o celebrità.

“Nello specifico”, ha affermato il dottor Turk, “questa sessione si concentrerà sull’uso dell’intelligenza artificiale generativa nella scienza, sia come forza trasformatrice nel perseguimento della scienza, sia come potenziale rischio di interruzione”.

La Dott.ssa Rebecca Willett ha iniziato la sua presentazione delineando come l'intelligenza artificiale generativa può essere sfruttata per supportare il processo di scoperta scientifica. Innanzitutto si è concentrata su come funzionano i modelli generativi. L'immagine seguente tratta dalle diapositive del Dr. Willett mostra come un modello linguistico, come ChatGPT, valuta la probabilità che si verifichi una parola, dato un insieme precedente di parole, e come un modello di generazione di immagini, come DALL-E 2, genera un'immagine da un dato prompt utilizzando le distribuzioni di probabilità apprese da miliardi di immagini durante l'addestramento.

“Utilizzando questo principio di distribuzione di probabilità, che è alla base di tutti i modelli generativi, questi modelli possono essere applicati a idee “lunare” nelle scienze, come generare possibili scenari climatici dato il clima attuale e le potenziali politiche, o generare nuovi microbiomi con funzionalità mirate, come uno che è particolarmente efficace nel decomporre la plastica”, afferma il dottor Willett.

Tuttavia, per la ricerca scientifica non è sufficiente utilizzare strumenti generativi standardizzati, come ChatGPT o DALL-E 2. Questi strumenti sono stati creati in un contesto molto diverso da quello in cui operano gli scienziati. Una differenza evidente tra un modello generativo standard e un modello scientifico sono i dati. Nella scienza spesso ci sono pochissimi dati su cui basare le ipotesi. I dati scientifici in genere provengono da simulazioni ed esperimenti, entrambi spesso costosi e dispendiosi in termini di tempo. A causa di queste limitazioni, gli scienziati devono scegliere attentamente quali esperimenti eseguire e come massimizzare l’efficienza e l’utilità di questi sistemi. I modelli standard, al contrario, attribuiscono molta meno importanza alla provenienza dei dati, preferendo massimizzare la quantità di dati su cui possono operare. Nella scienza, l’accuratezza dei set di dati e le loro origini sono incredibilmente importanti, perché gli scienziati devono giustificare la loro ricerca con solide prove empiriche.

"Inoltre, nelle scienze, i nostri obiettivi sono diversi dalla semplice produzione di cose plausibili", afferma il dottor Willett. “Dobbiamo capire come funzionano le cose al di fuori della gamma di ciò che abbiamo osservato finora”. Questo approccio è in contrasto con i modelli di intelligenza artificiale generativa che trattano i dati come rappresentativi dell’intera gamma di probabili osservazioni. Incorporare modelli fisici e vincoli nell’intelligenza artificiale generativa aiuta a garantire che rappresenti meglio i fenomeni fisici.

I modelli scientifici devono anche essere in grado di catturare eventi rari. “Possiamo tranquillamente ignorare molti eventi rari quando addestriamo ChatGPT, ma al contrario, gli eventi rari sono spesso ciò che ci interessa di più nel contesto scientifico, come in un modello climatico che prevede eventi meteorologici rari. Se utilizziamo un modello generativo che evita eventi rari e, ad esempio, non prevede mai un uragano, allora questo modello non sarà molto utile nella pratica”.

Una sfida correlata è lo sviluppo di modelli di intelligenza artificiale generativa per processi caotici, sensibili alle condizioni iniziali. Il Dr. Willett ha mostrato il video qui sotto, che mostra due particelle che si muovono nello spazio secondo le equazioni di Lorenz 63. Queste equazioni sono deterministiche, non casuali, ma date due posizioni iniziali leggermente diverse, puoi vedere che in qualsiasi momento le due particelle potrebbero trovarsi in posizioni molto diverse. Sviluppare modelli di intelligenza artificiale generativa che predicono il corso esatto di tali processi, che si verificano nella scienza del clima, nella turbolenza e nelle dinamiche di rete, è fondamentalmente difficile, ma nuovi approcci alla modellazione generativa possono garantire che i processi generati condividano caratteristiche statistiche chiave con dati scientifici reali.

[Contenuto incorporato]

Infine, il Dr. Willett ha affrontato il fatto che i dati scientifici spesso abbracciano un’enorme gamma di scale spaziali e temporali. Ad esempio, nella scienza dei materiali, i ricercatori studiano i materiali su scala nanometrica fino al sistema su larga scala, come un intero aeroplano. “Quella gamma di scale è molto diversa dai dati utilizzati nei modelli standard, e dobbiamo considerare come stiamo costruendo questi modelli generativi in ​​modo tale da influenzare accuratamente queste interazioni tra le scale”.

“I modelli generativi sono il futuro della scienza”, afferma il dottor Willett, “ma per garantire che vengano utilizzati in modo efficace, dobbiamo compiere progressi fondamentali nell’intelligenza artificiale e andare oltre il semplice inserimento dei dati in ChatGPT”.

Grazie mille per la lettura e, per favore, sintonizzatevi domani per leggere il riepilogo della presentazione del Dr. Markus Buehler sull'intelligenza artificiale generativa in meccanobiologia.

spot_img

L'ultima intelligenza

spot_img