Zephyrnet-logotyp

Löften och fallgropar Sammanfattning – Del fyra » CCC-blogg

Datum:

CCC stödde tre vetenskapliga sessioner vid årets AAAS Annual Conference. Den här veckan kommer vi att sammanfatta sessionens höjdpunkter, "Generativ AI i vetenskap: löften och fallgropar.” Den här panelen, modererad av Dr Matthew Turk, president för Toyota Technological Institute i Chicago), med Dr Rebecca Willett, professor i statistik och datavetenskap vid University of Chicago, Dr Markus Buehler, professor i teknik vid Massachusetts Institute of Technology, och Dr. Duncan Watson-Parris, biträdande professor vid Scripps Institution of Oceanography och Halıcıoğlu Data Science Institute vid UC San Diego. I del fyra sammanfattar vi panelens frågor och svar. 

En Q&A-session följde paneldeltagarens presentationer och Dr. Matthew Turk startade diskussionen. "'Löfter och fallgropar' står i titeln på den här panelen. Vi har diskuterat många av löftena, men vi har inte tagit itu med många av fallgroparna. Vad oroar dig om framtiden för generativ AI?”

"Tillförlitligheten och pålitligheten hos dessa modeller är ett stort problem", började Dr. Rebecca Wilett. "Dessa modeller kan förutsäga saker som är rimliga, men som saknar viktiga, framträdande element; Kan jag som människa känna igen att det är något som saknas där?”

Dr. Markus Buehler tillade att den faktiska förutsägelsen av en modell kan ta en sekund, men den experimentella processen för validering kan ta månader eller ett år, eller längre. Så hur ska vi agera under tiden när vi inte har verifierat resultaten? "Vi måste också utbilda nästa generation av generativa AI-utvecklare så att de designar modeller som är pålitliga och verifierbara, och att vi kan använda fysikbaserade insikter i vår konstruktion av dessa modeller."

Dr. Duncan Watson-Parris byggde på båda de föregående punkterna och sa: "Eftersom dessa modeller är designade för att generera rimliga resultat kan vi inte bara titta på resultaten för att verifiera deras riktighet. Generativa AI-forskare måste ha en djup förståelse för hur dessa modeller fungerar för att kunna verifiera deras resultat, vilket är anledningen till att det är så viktigt att utbilda nästa generation på rätt sätt."

Publikmedlem: ”Inom materialvetenskap vet vi riktningen framåt för att studera vissa material, men för andra, som supraledare i rumstemperatur, vet vi inte hur vi ska gå vidare. Hur tror du att vägen framåt i att studera dessa okända material kommer att se ut? Och hur ska den här typen av forskning möjliggöras ur en regulatorisk synvinkel?”

"Tja, jag är ingen expert på supraledarforskning", sa Dr Buehler, "så jag kommer inte att tala direkt om det, men jag kan prata allmänt om hur vi gör framsteg inom materialvetenskap, särskilt inom mitt proteinområde. och utveckling av biomaterial. Sättet vi gör framsteg är att ha förmågan att driva på kuvertet. Vi kör nya experiment och testar konstiga idéer och teorier och ser vilka som fungerar och varför. När det gäller hur vi ska möjliggöra denna forskning behöver vi fler modeller med öppen källkod med kollektiv tillgång. Jag skulle uppmuntra politiker att inte överreglera dessa tekniker, så att forskare och allmänheten har tillgång till dessa typer av modeller. Jag tror inte att det är en bra idé att hindra människor från att använda dessa modeller, särskilt när vi kan crowdsource idéer och utvecklingar och introducera kunskap från olika områden av mänsklig aktivitet. Till exempel, när tryckpressen uppfanns försökte myndigheterna att begränsa tillgången på denna teknik så att få böcker kunde läsas i massor, men detta försök misslyckades kapitalt. Det bästa sättet att skydda allmänheten är att underlätta tillgången till dessa modeller på ett sådant sätt att vi kan utveckla, utforska och utvärdera dem i stor utsträckning för maximal nytta för samhället."

Publikmedlem: "De flesta generativa AI-modeller idag är regressionsmodeller som fokuserar på att simulera eller emulera olika scenarier. Upptäckten inom vetenskapen drivs dock av de hypoteser och förutsägelser vi drömmer om. Så hur skapar vi modeller som är avsedda att skapa nya förutsägelser istället för de nuvarande modellerna som mest används för experiment?”

Dr. Buehler svarade först och sa: "Du har rätt, de flesta traditionella maskininlärningsmodeller är ofta regressionsbaserade, men de modeller vi pratade om idag fungerar annorlunda. När du sätter ihop system med flera agenter med många möjligheter börjar de faktiskt utforska nya scenarier och de börjar resonera och göra förutsägelser baserat på experimenten de har kört. De blir mer mänskliga. Du, som forskare, skulle inte köra ett experiment och bara vara klar – du skulle köra ett experiment och sedan börja titta på data och validera den och göra nya förutsägelser baserade på dessa data, för att koppla ihop prickarna och extrapolera genom göra hypoteser och avbilda hur ett nytt scenario skulle utvecklas. Du skulle experimentera, samla in ny data, utveckla en teori och kanske föreslå ett integrerat ramverk om en speciell fråga av intresse. Då skulle du försvara dina idéer mot dina kollegors kritik och kanske revidera din hypotes när ny information används. Det är så nya multi-agent kontradiktoriska system fungerar, men de kompletterar naturligtvis mänskliga färdigheter med en mycket större förmåga att resonera över stora mängder data och representationer av kunskap. Dessa modeller kan redan generera nya hypoteser som förskjuter höljet långt bortom vad som redan har studerats, vilket bidrar till den vetenskapliga processen för upptäckt och innovation."

"Jag skulle komplettera det", inflikade Dr. Willett, "med området för upptäckt av färdigställande och symbolisk regression som ett annat område som är mycket mer inriktat mot hypotesgenerering. Det pågår mycket arbete i det här utrymmet.”

Publikmedlem: "Hur ökar vi tillgången till dessa typer av modeller och övervinner hinder, som att de flesta modeller skapas för engelsktalande?"

Dr. Rebecca Willett svarade och sa: "Många människor har tillgång till dessa modeller, men att designa och träna dem kostar många miljoner dollar. Om bara en liten uppsättning organisationer kan sätta upp dessa modeller, så är det bara en mycket liten uppsättning människor som fattar besluten och prioriterar i det vetenskapliga samfundet. Och ofta är dessa organisationers och individers prioriteringar vinstdrivna. Som sagt, jag tror att landskapet börjar förändras. Organisationer som NSF försöker bygga infrastruktur som kan nås av det bredare forskarsamhället. Denna ansträngning liknar den tidiga utvecklingen av superdatorer. I början var forskare tvungna att lämna långa förslag för att få tillgång till en superdator. Jag tror att vi kommer att se liknande framväxande paradigm inom AI och generativ AI."

"Jag håller med", sa Dr. Watson-Parris. "Om man lägger till det från en regulatorisk sida, tror jag inte att vi ska reglera grundforskningen, kanske ansökningsutrymmena, men inte själva forskningen."

Tack så mycket för att du läste och håll utkik efter sammanfattningarna av våra andra två paneler på AAAS 2024.

plats_img

Senaste intelligens

plats_img