和风网标志

人工智能可以从头开始设计全新的蛋白质——是时候谈论生物安全了

日期:

二十年前,工程设计师蛋白质是一个梦想。

现在,多亏了人工智能,定制蛋白质已经多如牛毛。 定制蛋白质 通常具有特定的形状或组件,赋予它们新的自然能力。从更持久的药物和基于蛋白质的疫苗,到更环保的生物燃料和 吃塑料 蛋白质领域正在迅速成为一项变革性技术。

定制蛋白质设计取决于深度学习技术。借助大型语言模型(OpenAI 的重磅炸弹 ChatGPT 背后的人工智能),可以想象出数百万种超出人类想象的结构,生物活性设计蛋白库将迅速扩展。

华盛顿大学的尼尔·金博士最近表示:“它具有巨大的力量” 告诉 自然。 “一年半前这是不可能的事情,现在你就可以做到。”

然而,权力越大,责任越大。随着新设计的蛋白质越来越多地在医学和生物工程中得到应用,科学家们现在想知道:如果这些技术被用于邪恶目的,会发生什么?

最近的一篇文章在 科学 强调了设计蛋白质的生物安全性需求。与正在进行的有关人工智能安全的对话类似,作者表示,现在是时候考虑生物安全风险和政策了,这样定制蛋白质就不会失控。

这篇文章是由该领域的两位专家撰写的。一、大卫·贝克博士,该中心主任 蛋白质设计研究所 华盛顿大学博士领导了 RoseTTAFold 的开发,该算法解决了仅从氨基酸序列解码蛋白质结构的五年难题。另一位是哈佛医学院的乔治·丘奇博士,他是基因工程和合成生物学领域的先驱。

他们建议合成蛋白质需要将条形码嵌入到每个新蛋白质的基因序列中。如果任何设计蛋白成为威胁(例如,可能引发危险的爆发),其条形码将可以轻松追溯到其起源。

该系统基本上提供了“审计跟踪”,两人 .

世界碰撞

设计蛋白与人工智能有着千丝万缕的联系。潜在的生物安全政策也是如此。

十多年前,贝克的实验室使用软件设计和构建了一种名为 Top7 的蛋白质。蛋白质由称为氨基酸的构建块组成,每种氨基酸都编码在我们的 DNA 内。就像绳子上的珠子一样,氨基酸随后被旋转和褶皱成特定的 3D 形状,这些形状通常进一步融入支持蛋白质功能的复杂结构。

Top7 无法与天然细胞成分“对话”——它没有任何生物效应。但即便如此,球队 总结 设计新的蛋白质使得探索“自然界中尚未观察到的蛋白质宇宙的大片区域”成为可能。

输入人工智能。与传统实验室工作相比,最近出现了多种策略以超音速设计新蛋白质。

一种是基于结构的人工智能,类似于 DALL-E 等图像生成工具。这些人工智能系统接受噪声数据的训练,并学习消除噪声以找到真实的蛋白质结构。它们被称为扩散模型,逐渐学习与生物学兼容的蛋白质结构。

另一种策略依赖于大型语言模型。与 ChatGPT 一样,这些算法可以快速找到蛋白质“单词”之间的联系,并将这些联系提炼成一种生物语法。这些模型生成的蛋白质链可能会折叠成身体可以解读的结构。 一个例子 是ProtGPT2,它 可以工程师 活性蛋白质的形状可以带来新的特性。

数字到物理

这些人工智能蛋白质设计程序敲响了警钟。蛋白质是生命的基石,变化可能会极大地改变细胞对药物、病毒或其他病原体的反应。

去年,世界各国政府宣布了监督人工智能安全的计划。该技术并未被定位为威胁。相反,立法者谨慎地充实了政策,确保研究遵循隐私法并促进经济、公共卫生和国防。欧盟带头同意 人工智能法 限制某些领域的技术。

法规中没有直接提及合成蛋白质。贝克和丘奇写道,这对于制造设计蛋白来说是个好消息,过度限制性的监管可能会限制这种蛋白的设计。然而,新的人工智能立法正在制定中,联合国人工智能咨询机构将分享关于人工智能的指导方针。 国际监管 今年年中。

由于用于制造设计蛋白的人工智能系统高度专业化,因此如果该领域联合起来进行全球自我监管,它们可能仍会受到监管雷达的监控。

在中国、德国、意大利、韩国和美国的 2023人工智能安全峰会确实讨论了人工智能支持的蛋白质设计,专家们一致认为记录每种新蛋白质的基础 DNA 是关键。与天然蛋白质一样,设计蛋白质也是由遗传密码构建的。将所有合成 DNA 序列记录在数据库中可以更容易地发现潜在有害设计的危险信号,例如,如果一种新蛋白质具有与已知致病蛋白质相似的结构。

生物安全不会压制数据共享。合作对于科学至关重要,但作者承认仍然有必要保护商业秘密。就像人工智能一样,一些设计蛋白可能具有潜在用途,但公开分享太危险。

解决这个难题的一种方法是直接在合成过程本身中添加安全措施。例如,作者建议在每个新的基因序列中添加一个由随机 DNA 字母组成的条形码。为了构建蛋白质,合成机会搜索其 DNA 序列,只有找到代码后才会开始构建蛋白质。

换句话说,蛋白质的原始设计者可以选择与谁共享合成——或者是否共享——同时仍然能够在出版物中描述他们的结果。

将制造新蛋白质与合成机器联系起来的条形码策略也将增强安全性并阻止不良行为者,从而难以重新制造具有潜在危险的产品。

作者写道:“如果世界任何地方出现新的生物威胁,相关的 DNA 序列都可以追溯到其起源。”

这将是一条艰难的道路。作者写道,设计蛋白的安全性将取决于科学家、研究机构和政府的全球支持。不过,之前也曾取得过成功。全球团体在干细胞研究、基因工程、脑植入和人工智能等其他有争议的领域制定了安全和共享准则。虽然并不总是遵循——CRISPR婴儿就是一个臭名昭著的例子——在很大程度上,这些国际准则帮助以安全和公平的方式推动尖端研究的发展。

对于贝克和丘奇来说,关于生物安全的公开讨论不会减缓这一领域的发展。相反,它可以团结不同的部门并参与公众讨论,以便定制蛋白质设计能够进一步蓬勃发展。

图片来源: University of Washington

现货图片

最新情报

现货图片