Zephyrnet-logotyp

Löften och fallgropar Sammanfattning – del två » CCC-blogg

Datum:

CCC stödde tre vetenskapliga sessioner vid årets AAAS årliga konferens, och om du inte kunde närvara personligen kommer vi att sammanfatta varje session. Den här veckan kommer vi att sammanfatta sessionens höjdpunkter, "Generativ AI i vetenskap: löften och fallgropar.” I del två kommer vi att sammanfatta Dr Markus Buehlers presentation om Generativ AI i mekanobiologi.

Dr. Markus Buehler började sin presentation med att ta upp hur generativa modeller kan tillämpas i studiet av materialvetenskap. Historiskt sett inom materialvetenskap skulle forskare samla in data eller utveckla ekvationer för att beskriva hur material beter sig och lösa dem med penna och papper. Framväxten av datorer gjorde det möjligt för forskare att lösa dessa ekvationer mycket snabbare och behandla mycket komplexa system, till exempel genom att använda statistisk mekanik. För vissa problem räcker dock inte traditionell datorkraft. Till exempel, bilden nedan visar antalet möjliga konfigurationer av ett enda litet protein (20 ^100  eller 1.27×10^130 mönster). Denna mängd möjliga konfigurationer är större än antalet atomer i det observerbara universum (10^80 atomer) vilket gör detta problem svårlöst för även de största superdatorerna. 

Före generativa modeller begränsades ekvationerna och algoritmerna som skapats av forskare av en viss egenskap som delas av alla forskare sedan tidernas begynnelse: mänskligheten. "Generativ AI tillåter oss att gå bortom den mänskliga fantasin så att vi kan uppfinna och upptäcka saker som vi inte har kunnat hittills, antingen för att vi inte är tillräckligt smarta eller för att vi inte har kapacitet att ha tillgång till varje datapunkt samtidigt”, säger Dr Buehler. "Generativ AI kan användas för att identifiera nya ekvationer och algoritmer och kan lösa dessa ekvationer åt oss. Dessutom kan generativa modeller också förklara för oss hur de utvecklade och löste dessa ekvationer, som på höga nivåer av komplexitet är absolut nödvändiga för att forskare ska förstå modellers "tänkeprocesser". En nyckelaspekt av hur dessa modeller fungerar är att översätta information (t.ex. resultat av mätningar) till kunskap genom att lära sig en grafisk representation av den.  

Källa: MJ Buehler, Accelerating Scientific Discovery with Generative Knowledge Extraction, Graph-Based Representation och Multimodal Intelligent Graph Reasoning, arXiv, 2024

Figuren nedan visar en ny materialdesign, en hierarkisk mycelbaserad komposit, konstruerad av generativ AI och med en aldrig tidigare skådad kombination av mycel rhizomorphs, kollagen, mineralfyllmedel, ytfunktionalisering och ett komplext samspel av porositet och material. 

Källa: MJ Buehler, Accelerating Scientific Discovery with Generative Knowledge Extraction, Graph-Based Representation och Multimodal Intelligent Graph Reasoning, arXiv, 2024. Vänster: Mycrlium-komposit. Till höger: Proteindesign. 

Dessutom kan generativ AI hjälpa oss att visualisera komplexa system. Istället för att beskriva interaktioner mellan atomer kan AI representera dessa interaktioner i grafer, som mekanistiskt beskriver hur material fungerar, beter sig och interagerar i olika skalor. Dessa verktyg är kraftfulla, men ensamma är de inte tillräckligt starka för att lösa dessa problems höga komplexitet. För att lösa detta kan vi kombinera många modeller, till exempel en modell som kan göra fysiksimuleringar och en annan som kan förutsäga krafter och spänningar och hur man designar proteiner. När dessa modeller kommunicerar blir de agentmodeller, där varje enskild modell är en agent med ett specifikt syfte. Resultatet av varje modell kommuniceras till de andra modellerna och beaktas i den övergripande utvärderingen av modellernas resultat. Agentmodeller kan köra simuleringar på befintlig data och generera ny data. Så för områden med begränsad eller noll data kan forskare använda fysikmodeller för att generera data att köra simuleringar på. "Denna typ av modellering är ett av de framtida tillväxtområdena för generativa modeller", säger Dr. Buehler. Dessa typer av modeller kan lösa problem som tidigare ansetts vara svårlösta på superdatorer, och vissa av dessa modeller kan till och med köras på en vanlig bärbar dator.

En av huvudutmaningarna med att designa sådana fysikinspirerade generativa AI-modeller som forskare fortfarande tar itu med är hur man bygger modellerna elegant, och hur man gör dem mer lika den mänskliga hjärnan eller biologiska system. Biologiska system har förmågan att ändra sitt beteende, till exempel när du skär din hud kommer skäret att läka med tiden. Modeller kan byggas för att fungera på liknande sätt. Istället för att träna en modell att hela tiden läka ett skärsår, kan vi träna dem att ha förmågan att återmontera dem för att agera dynamiskt – i någon mening tränar vi modeller att först tänka på frågan som ställs och hur de kan konfigurera om. 'själv' för att bäst lösa en viss uppgift. Detta kan användas för att göra kvantitativa förutsägelser (t.ex. lösa en mycket komplex uppgift för att förutsäga energilandskapet för ett protein), göra kvalitativa förutsägelser och resonera över resultaten, och integrera olika expertis och färdigheter när svar på komplexa uppgifter utvecklas. Viktigt är att modellerna också kan förklara för oss hur de kom fram till lösningen, hur ett visst system fungerar och andra detaljer som kan vara av intresse för den mänskliga vetenskapsmannen. Vi kan sedan köra experiment för att förutsäga och verifiera resultaten av dessa simuleringar för fall som är de mest lovande idéerna, till exempel för materialdesignapplikationer.

Dr. Buehler talade sedan om specifika tillämpningar av dessa generativa modeller inom materialvetenskap. "För att beräkna energilandskapet för att lösa det omvända veckningsproblemet givet ett visst protein behöver vi inte ens veta hur proteinet ser ut, jag behöver bara känna till byggstenarna och DNA-sekvensen som definierar detta protein och villkoren för experiment utförs i. Om du vill ha en viss sorts protein med ett visst energilandskap kan vi också designa det proteinet, på begäran. Agentmodeller kan göra detta eftersom de har kapacitet att kombinera olika modeller, förutsägelser och data. Detta kan användas för att syntetisera komplexa nya proteiner som inte finns i naturen. Vi kan uppfinna proteiner som har superstarka fibrer som ersättning för plast, eller skapa bättre konstgjord mat, eller nya batterier. Vi kan använda naturens verktygslåda för att expandera förbi vad naturen har att erbjuda, och gå långt bortom evolutionära principer. Vi kan till exempel designa material för vissa ändamål, till exempel ett material som är mycket stretchigt eller har vissa optiska egenskaper, eller material som ändrar sina egenskaper utifrån yttre signaler. De modeller som dyker upp nu kan inte bara lösa dessa problem, utan ger också förmågan att förklara för oss hur dessa problem löses. De kan också klargöra varför vissa strategier fungerar och andra inte. De kan förutsäga ny forskning, som att be en modell förutsäga hur ett visst material kommer att bete sig i detalj, och vi kan validera detta med forskningsstudier i labb eller med fysiksimuleringar. Det här är häpnadsväckande och låter futuristiskt, men det händer faktiskt idag.”

plats_img

Senaste intelligens

plats_img