Zephyrnet-logotyp

AI kan designa helt nya proteiner från grunden – det är dags att prata om biosäkerhet

Datum:

För två decennier sedan var ingenjörsdesignerproteiner en dröm.

Nu, tack vare AI, är anpassade proteiner en krona ett dussin. Gjorda på beställning proteiner har ofta specifika former eller komponenter som ger dem förmågor som är nya för naturen. Från mer långvariga läkemedel och proteinbaserade vacciner, till grönare biobränslen och plastätande proteiner, håller området snabbt på att bli en transformativ teknologi.

Anpassad proteindesign beror på tekniker för djupinlärning. Med stora språkmodeller – AI:n bakom OpenAI:s blockbuster ChatGPT – som drömmer om miljontals strukturer bortom mänsklig fantasi, kommer biblioteket med bioaktiva designerproteiner att expandera snabbt.

"Det är enormt stärkande," Dr Neil King vid University of Washington nyligen berättade Natur. "Saker som var omöjliga för ett och ett halvt år sedan - nu gör du det bara."

Men med stor makt kommer ett stort ansvar. När nydesignade proteiner alltmer får dragkraft för användning inom medicin och bioteknik, undrar forskare nu: Vad händer om dessa teknologier används för skändliga syften?

En färsk uppsats i Vetenskap betonar behovet av biosäkerhet för designerproteiner. I likhet med pågående samtal om AI-säkerhet, säger författarna att det är dags att överväga biosäkerhetsrisker och policyer så att anpassade proteiner inte blir oseriösa.

Uppsatsen är skriven av två experter på området. En, Dr. David Baker, chefen för Institute for Protein Design vid University of Washington, ledde utvecklingen av RoseTTAFold - en algoritm som knäckte halvt decenniumsproblemet med att avkoda proteinstruktur från enbart dess aminosyrasekvenser. Den andra, Dr. George Church vid Harvard Medical School, är en pionjär inom genteknik och syntetisk biologi.

De föreslår att syntetiska proteiner behöver streckkoder inbäddade i varje nytt proteins genetiska sekvens. Om något av designproteinerna blir ett hot – säg, potentiellt utlösa ett farligt utbrott – skulle dess streckkod göra det lätt att spåra tillbaka till dess ursprung.

Systemet ger i princip "ett granskningsspår", duon skriva.

Världar kolliderar

Designerproteiner är oupplösligt bundna till AI. Så är potentiella biosäkerhetspolicyer.

För över ett decennium sedan använde Bakers lab mjukvara för att designa och bygga ett protein kallat Top7. Proteiner är gjorda av byggstenar som kallas aminosyror, som var och en är kodad inuti vårt DNA. Liksom pärlor på ett snöre snurras och rynkas aminosyror sedan till specifika 3D-former, som ofta vävs ytterligare in i sofistikerade arkitekturer som stödjer proteinets funktion.

Top7 kunde inte "prata" med naturliga cellkomponenter - det hade inga biologiska effekter. Men även då laget ingås att design av nya proteiner gör det möjligt att utforska "de stora regioner av proteinuniversumet som ännu inte observerats i naturen."

Ange AI. Flera strategier tog nyligen fart för att designa nya proteiner i överljudshastigheter jämfört med traditionellt labbarbete.

Den ena är strukturbaserad AI som liknar bildgenererande verktyg som DALL-E. Dessa AI-system tränas på bullriga data och lär sig att ta bort bruset för att hitta realistiska proteinstrukturer. De kallas diffusionsmodeller och lär sig gradvis proteinstrukturer som är kompatibla med biologi.

En annan strategi bygger på stora språkmodeller. Liksom ChatGPT hittar algoritmerna snabbt kopplingar mellan protein-"ord" och destillerar dessa kopplingar till en sorts biologisk grammatik. Proteinsträngarna som dessa modeller genererar kommer sannolikt att vikas till strukturer som kroppen kan dechiffrera. Ett exempel är ProtGPT2, som kan ingenjör aktiva proteiner med former som kan leda till nya egenskaper.

Digital till fysisk

Dessa AI-proteindesignprogram slår larmklockor. Proteiner är livets byggstenar – förändringar kan dramatiskt förändra hur celler reagerar på droger, virus eller andra patogener.

Förra året tillkännagav regeringar runt om i världen planer på att övervaka AI-säkerheten. Tekniken var inte positionerad som ett hot. Istället utvecklade lagstiftarna försiktigt policyer som säkerställer att forskning följer integritetslagar och stärker ekonomin, folkhälsan och det nationella försvaret. Som ledare för laddningen enades Europeiska unionen om AI-lagen att begränsa tekniken inom vissa domäner.

Syntetiska proteiner nämndes inte direkt i regelverket. Det är goda nyheter för att tillverka designerproteiner, som kan täckas av alltför restriktiva regleringar, skriver Baker och Church. Men ny AI-lagstiftning är på väg, med FN:s rådgivande organ för AI som kommer att dela riktlinjer för internationell reglering i mitten av detta år.

Eftersom AI-systemen som används för att tillverka designerproteiner är mycket specialiserade, kan de fortfarande flyga under regulatoriska radarer - om fältet förenas i en global strävan att självreglera.

Vid 2023 AI Safety Summit, som diskuterade AI-aktiverad proteindesign, var experter överens om att dokumentera varje nytt proteins underliggande DNA är nyckeln. Liksom deras naturliga motsvarigheter är designproteiner också byggda från genetisk kod. Att logga alla syntetiska DNA-sekvenser i en databas kan göra det lättare att upptäcka röda flaggor för potentiellt skadliga mönster – till exempel om ett nytt protein har strukturer som liknar kända patogena.

Biosäkerhet klämmer inte ihop datadelning. Samarbete är avgörande för vetenskapen, men författarna erkänner att det fortfarande är nödvändigt att skydda affärshemligheter. Och som i AI kan vissa designerproteiner vara potentiellt användbara men för farliga att dela öppet.

Ett sätt att kringgå denna gåta är att direkt lägga till säkerhetsåtgärder till själva syntesprocessen. Till exempel föreslår författarna att man lägger till en streckkod – gjord av slumpmässiga DNA-bokstäver – till varje ny genetisk sekvens. För att bygga proteinet söker en syntesmaskin igenom dess DNA-sekvens, och först när den hittar koden börjar den bygga proteinet.

Med andra ord kan de ursprungliga formgivarna av proteinet välja vem de ska dela syntesen med – eller om de ska dela den överhuvudtaget – samtidigt som de fortfarande kan beskriva sina resultat i publikationer.

En streckkodsstrategi som knyter tillverkning av nya proteiner till en syntesmaskin skulle också öka säkerheten och avskräcka dåliga aktörer, vilket gör det svårt att återskapa potentiellt farliga produkter.

"Om ett nytt biologiskt hot dyker upp någonstans i världen, kan de associerade DNA-sekvenserna spåras till deras ursprung", skrev författarna.

Det kommer att bli en tuff väg. Designerproteinsäkerhet kommer att bero på globalt stöd från forskare, forskningsinstitutioner och regeringar, skriver författarna. Det har dock varit tidigare framgångar. Globala grupper har etablerat riktlinjer för säkerhet och delning inom andra kontroversiella områden, såsom stamcellsforskning, genteknik, hjärnimplantat och AI. Även om det inte alltid följs—CRISPR-bebisar är ett ökänt exempel— För det mesta har dessa internationella riktlinjer hjälpt till att föra spjutspetsforskning framåt på ett säkert och rättvist sätt.

För Baker och Church kommer öppna diskussioner om biosäkerhet inte att bromsa fältet. Snarare kan det samla olika sektorer och engagera offentlig diskussion så att anpassad proteindesign kan utvecklas ytterligare.

Image Credit: University of Washington

plats_img

Senaste intelligens

plats_img