Zephyrnet-logo

Samenvatting van beloften en valkuilen – Deel één » CCC Blog

Datum:

CCC ondersteunde drie wetenschappelijke sessies op de jaarlijkse AAAS-conferentie van dit jaar, en voor het geval u er niet persoonlijk bij kon zijn, zullen we elke sessie samenvatten. Deze week vatten we de hoogtepunten van de sessie samen: “Generatieve AI in de wetenschap: beloften en valkuilen.” In deel één zullen we de inleiding en de presentatie door Dr. Rebecca Willett samenvatten.

CCC's eerste AAAS-panel van de jaarvergadering van 2024 vond plaats op vrijdag 16 februari, de tweede dag van de conferentie. Het panel, gemodereerd door het eigen panel van CCC Dr. Matthew Turk, president van het Toyota Technological Institute in Chicago, bestond uit experts die kunstmatige intelligentie toepassen op verschillende wetenschappelijke gebieden. Dr. Rebecca Willett, hoogleraar statistiek en computerwetenschappen aan de Universiteit van Chicago, concentreerde haar presentatie op hoe generatieve modellen in de wetenschappen kunnen worden gebruikt en waarom kant-en-klare modellen niet voldoende zijn om in wetenschappelijk onderzoek te worden toegepast. Dr. Markus Bühler, hoogleraar techniek aan het Massachusetts Institute of Technology, sprak over generatieve modellen zoals toegepast in de materiaalkunde, en Dr. Duncan Watson-Parris, assistent-professor bij Scripps Institution of Oceanography en het Halıcıoğlu Data Science Institute aan UC San Diego, besprak hoe generatieve modellen kunnen worden gebruikt bij het bestuderen van de klimaatwetenschappen.

Dr. Turk, een expert op het gebied van computervisie en mens-computerinteractie, begon het panel door generatieve AI te onderscheiden van alle AI. “De kern van generatieve AI-toepassingen zijn generatieve modellen die zijn samengesteld uit diepe neurale netwerken die de structuur van hun omvangrijke trainingsgegevens leren kennen en vervolgens nieuwe gegevens genereren op basis van wat ze hebben geleerd.”

Dr. Turk schetste ook de zorgen onder de bevolking over generatieve systemen, zowel vanwege het falen van de systemen zelf, zoals systemen die niet-bestaande juridische instructies citeren, als vanwege het gebruik ervan door slechte actoren om nep-inhoud te genereren, zoals die van nep-audio of video van politici of beroemdheden.

“Specifiek”, aldus Dr. Turk, “zal deze sessie zich richten op het gebruik van generatieve AI in de wetenschap, zowel als een transformerende kracht in het streven naar wetenschap en ook als een potentieel risico op ontwrichting.”

Dr. Rebecca Willett begon haar presentatie door te schetsen hoe generatieve AI kan worden ingezet om het wetenschappelijke ontdekkingsproces te ondersteunen. Ze concentreerde zich eerst op hoe generatieve modellen werken. De onderstaande afbeelding uit de dia's van Dr. Willett laat zien hoe een taalmodel, zoals ChatGPT, de waarschijnlijkheid evalueert dat een woord voorkomt, gegeven een eerdere reeks woorden, en hoe een model voor het genereren van afbeeldingen, zoals DALL-E 2, een afbeelding genereert op basis van een bepaalde prompt, met behulp van waarschijnlijkheidsverdelingen die tijdens de training uit miljarden afbeeldingen zijn geleerd.

“Door gebruik te maken van dit principe van waarschijnlijkheidsverdelingen, dat ten grondslag ligt aan alle generatieve modellen, kunnen deze modellen worden toegepast op moonshot-ideeën in de wetenschappen, zoals het genereren van mogelijke klimaatscenario’s gegeven het huidige klimaat en potentieel beleid, of het genereren van nieuwe microbiomen met gerichte functionaliteit, zoals een die bijzonder effectief is in het afbreken van kunststoffen”, zegt Dr. Willett.

Het is echter niet voldoende om kant-en-klare generatieve tools, zoals ChatGPT of DALL-E 2, te gebruiken voor wetenschappelijk onderzoek. Deze tools zijn gemaakt in een omgeving die heel anders is dan de context waarin wetenschappers opereren. Een voor de hand liggend verschil tussen een kant-en-klaar generatief model en een wetenschappelijk model zijn de gegevens. In de wetenschap zijn er vaak heel weinig gegevens waarop hypothesen kunnen worden gebaseerd. Wetenschappelijke gegevens komen doorgaans voort uit simulaties en experimenten, die beide vaak duur en tijdrovend zijn. Vanwege deze beperkingen moeten wetenschappers zorgvuldig kiezen welke experimenten ze willen uitvoeren en hoe ze de efficiëntie en bruikbaarheid van deze systemen kunnen maximaliseren. Kant-en-klare modellen hechten daarentegen veel minder belang aan de herkomst van gegevens, dan aan het maximaliseren van de hoeveelheid gegevens waarmee ze kunnen werken. In de wetenschap zijn de nauwkeurigheid van datasets en hun oorsprong ongelooflijk belangrijk, omdat wetenschappers hun onderzoek moeten rechtvaardigen met robuust empirisch bewijs.

“Bovendien zijn onze doelstellingen in de wetenschappen anders dan alleen het produceren van dingen die plausibel zijn”, zegt Dr. Willett. “We moeten begrijpen hoe dingen werken buiten het bereik van wat we tot nu toe hebben waargenomen.” Deze benadering staat op gespannen voet met generatieve AI-modellen die gegevens behandelen als representatief voor het volledige scala aan waarschijnlijke waarnemingen. Het opnemen van fysieke modellen en beperkingen in generatieve AI zorgt ervoor dat deze fysieke verschijnselen beter zal weergeven.

Wetenschappelijke modellen moeten ook zeldzame gebeurtenissen kunnen vastleggen. “We kunnen veilig veel zeldzame gebeurtenissen negeren als we ChatGPT trainen, maar zeldzame gebeurtenissen zijn daarentegen vaak waar we in de context van de wetenschap het meest om geven, zoals in een klimaatmodel dat zeldzame weersgebeurtenissen voorspelt. Als we een generatief model gebruiken dat zeldzame gebeurtenissen vermijdt en bijvoorbeeld nooit een orkaan voorspelt, dan zal dit model in de praktijk niet erg bruikbaar zijn.”

Een gerelateerde uitdaging is het ontwikkelen van generatieve AI-modellen voor chaotische processen, die gevoelig zijn voor initiële omstandigheden. Dr. Willett liet de onderstaande video zien, waarin twee deeltjes in de ruimte bewegen volgens de Lorenz 63-vergelijkingen. Deze vergelijkingen zijn deterministisch en niet willekeurig, maar gegeven twee enigszins verschillende startlocaties kun je zien dat de twee deeltjes zich op een gegeven moment op heel verschillende locaties kunnen bevinden. Het ontwikkelen van generatieve AI-modellen die het exacte verloop voorspellen van dergelijke processen, die zich voordoen in de klimaatwetenschap, turbulentie en netwerkdynamiek, is fundamenteel moeilijk, maar nieuwe benaderingen van generatieve modellering kunnen ervoor zorgen dat gegenereerde processen belangrijke statistische kenmerken delen met echte wetenschappelijke gegevens.

[Ingesloten inhoud]

Ten slotte ging Dr. Willett in op het feit dat wetenschappelijke gegevens vaak een enorm scala aan ruimtelijke en temporele schalen bestrijken. In de materiaalkunde bestuderen onderzoekers bijvoorbeeld materialen op nanometerschaal, van mononymers tot aan het grootschalige systeem, zoals een heel vliegtuig. “Dat scala aan schalen is heel anders dan de gegevens die worden gebruikt in kant-en-klare modellen, en we moeten overwegen hoe we deze generatieve modellen opbouwen op een manier die deze interacties tussen schalen accuraat beïnvloedt.”

“Generatieve modellen zijn de toekomst van de wetenschap”, zegt Dr. Willett, “maar om ervoor te zorgen dat ze effectief worden gebruikt, moeten we fundamentele vooruitgang boeken op het gebied van AI en verder gaan dan het inpluggen van gegevens in ChatGPT.”

Hartelijk dank voor het lezen, en luister morgen naar de samenvatting van de presentatie van Dr. Markus Buehler over generatieve AI in de mechanobiologie.

spot_img

Laatste intelligentie

spot_img