Zephyrnet-logo

Løfter og fallgruver Oppsummering – del to » CCC-blogg

Dato:

CCC støttet tre vitenskapelige sesjoner på årets AAAS årlige konferanse, og i tilfelle du ikke var i stand til å delta personlig, vil vi oppsummere hver økt. Denne uken vil vi oppsummere høydepunktene fra økten, "Generativ AI i vitenskap: løfter og fallgruver." I del to vil vi oppsummere Dr. Markus Buehlers presentasjon om Generative AI in Mechanobiology.

Dr. Markus Buehler begynte sin presentasjon med å ta for seg hvordan generative modeller kan brukes i studiet av materialvitenskap. Historisk sett innen materialvitenskap ville forskere samlet inn data eller utviklet ligninger for å beskrive hvordan materialer oppfører seg, og løse dem med penn og papir. Fremveksten av datamaskiner gjorde det mulig for forskere å løse disse ligningene mye raskere og behandle svært komplekse systemer, for eksempel ved hjelp av statistisk mekanikk. For noen problemer er imidlertid ikke tradisjonell datakraft nok. For eksempel, bildet nedenfor viser antall mulige konfigurasjoner av et enkelt lite protein (20 ^100  eller 1.27×10^130 design). Denne mengden av mulige konfigurasjoner er større enn antall atomer i det observerbare universet (10^80 atomer) som gjør dette problemet uløselig for selv de største superdatamaskinene. 

Før generative modeller var ligningene og algoritmene skapt av forskere begrenset av en viss egenskap som ble delt av alle forskere siden tidenes begynnelse: menneskeheten. "Generativ AI lar oss gå utover den menneskelige fantasien slik at vi kan finne opp og oppdage ting vi ikke har vært i stand til så langt, enten fordi vi ikke er smarte nok eller fordi vi ikke har kapasitet til å ha tilgang til alle datapunkter samtidig,” sier Dr. Buehler. «Generativ AI kan brukes til å identifisere nye ligninger og algoritmer, og kan løse disse ligningene for oss. Dessuten kan generative modeller også forklare oss hvordan de utviklet og løste disse ligningene, som på høye nivåer av kompleksitet er helt nødvendig for at forskere skal forstå modellenes 'tankeprosesser'.» Et sentralt aspekt ved hvordan disse modellene fungerer er å oversette informasjon (f.eks. resultater av målinger) til kunnskap ved å lære en grafrepresentasjon av den.  

Kilde: MJ Buehler, Akselererer vitenskapelig oppdagelse med generativ kunnskapsekstraksjon, grafbasert representasjon og multimodal intelligent grafresonnering, arXiv, 2024

Figuren nedenfor viser en ny materialdesign, en hierarkisk mycelbasert kompositt, konstruert av generativ AI og med en aldri tidligere sett kombinasjon av mycel rhizomorphs, kollagen, mineralfyllstoff, overflatefunksjonalisering og et komplekst samspill av porøsitet og materiale. 

Kilde: MJ Buehler, Accelerating Scientific Discovery with Generative Knowledge Extraction, Graph-Based Representation, and Multimodal Intelligent Graph Reasoning, arXiv, 2024. Venstre: Mycrlium-kompositt. Til høyre: Proteindesign. 

Videre kan generativ AI hjelpe oss med å visualisere komplekse systemer. I stedet for å beskrive interaksjoner mellom atomer, kan AI representere disse interaksjonene i grafer, som mekanistisk beskriver hvordan materialer fungerer, oppfører seg og samhandler i forskjellige skalaer. Disse verktøyene er kraftige, men alene er de ikke sterke nok til å løse den høye kompleksiteten til disse problemene. For å løse dette kan vi kombinere mange modeller, for eksempel en modell som kan gjøre fysikksimuleringer og en annen som kan forutsi krefter og påkjenninger og hvordan man kan designe proteiner. Når disse modellene kommuniserer blir de agentmodeller, der hver enkelt modell er en agent med et bestemt formål. Resultatene fra hver modell kommuniseres til de andre modellene og vurderes i den samlede evalueringen av modellenes resultater. Agentmodeller kan kjøre simuleringer på eksisterende data og generere nye data. Så for områder med begrenset eller null data, kan forskere bruke fysikkmodeller til å generere data å kjøre simuleringer på. "Denne typen modellering er et av de fremtidige vekstområdene for generative modeller," sier Dr. Buehler. Denne typen modeller kan løse problemer som tidligere ble ansett for å være vanskelige å løse på superdatamaskiner, og noen av disse modellene kan til og med kjøres på en standard bærbar datamaskin.

En av hovedutfordringene ved å designe slike fysikk-inspirerte generative AI-modeller som forskere fortsatt tar for seg, er hvordan man bygger modellene elegant, og hvordan man kan gjøre dem mer lik den menneskelige hjernen eller biologiske systemer. Biologiske systemer har evnen til å endre oppførselen sin, for eksempel når du kutter huden din, vil kuttet gro over tid. Modeller kan bygges for å fungere på samme måte. I stedet for å trene en modell til å helbrede et kutt til enhver tid, kan vi trene dem til å ha evnen til å sette dem sammen til å handle dynamisk – på en eller annen måte trener vi modeller til først å tenke på spørsmålet som stilles og hvordan de kan være i stand til å rekonfigurere 'selv' for å best mulig løse en bestemt oppgave. Dette kan brukes til å gjøre kvantitative spådommer (f.eks. løse en svært kompleks oppgave for å forutsi energilandskapet til et protein), gjøre kvalitative spådommer og resonnere over resultatene, og integrere ulik ekspertise og ferdigheter etter hvert som svar på komplekse oppgaver utvikles. Det er viktig at modellene også kan forklare oss hvordan de kom frem til løsningen, hvordan et bestemt system fungerer og andre detaljer som kan være av interesse for menneskeforskeren. Vi kan deretter kjøre eksperimenter for å forutsi og verifisere resultatene av disse simuleringene for tilfeller som er de mest lovende ideene, for eksempel for materialdesignapplikasjoner.

Dr. Buehler snakket deretter om spesifikke anvendelser av disse generative modellene i materialvitenskap. "For å beregne energilandskapet for å løse det omvendte foldeproblemet gitt et bestemt protein, trenger vi ikke engang å vite hvordan proteinet ser ut, jeg trenger bare å vite byggesteinene og DNA-sekvensen som definerer dette proteinet og forholdene eksperimentet utføres i. Hvis du vil ha en spesiell type protein med et visst energilandskap, kan vi også designe det proteinet etter behov. Agentmodeller kan gjøre dette fordi de har kapasitet til å kombinere ulike modeller, spådommer og data. Dette kan brukes til å syntetisere komplekse nye proteiner som ikke finnes i naturen. Vi kan finne opp proteiner som har supersterke fibre som erstatning for plast, eller lage bedre kunstig mat, eller nye batterier. Vi kan bruke naturens verktøykasse til å utvide forbi det naturen har å tilby, og gå langt utover evolusjonære prinsipper. For eksempel kan vi designe materialer for bestemte formål, for eksempel et materiale som er svært tøyelig eller har visse optiske egenskaper, eller materialer som endrer egenskapene sine basert på eksterne signaler. Modellene som dukker opp nå er ikke bare i stand til å løse disse problemene, men gir også muligheten til å forklare oss hvordan disse problemene løses. De kan også belyse hvorfor visse strategier fungerer og andre ikke. De kan forutsi ny forskning, som å be en modell forutsi hvordan et bestemt materiale vil oppføre seg i stor detalj, og vi kan validere dette med forskningsstudier i laboratorier, eller med fysikksimuleringer. Dette er sjokkerende, og høres futuristisk ut, men det skjer faktisk i dag.»

spot_img

Siste etterretning

spot_img