Logo Zephyrnet

AI có thể thiết kế các protein hoàn toàn mới ngay từ đầu—Đã đến lúc nói về an toàn sinh học

Ngày:

Hai thập kỷ trước, nhà thiết kế kỹ thuật protein là một giấc mơ.

Giờ đây, nhờ có AI, các protein tùy chỉnh đã trở nên dễ dàng hơn rất nhiều. Protein sản xuất theo đơn đặt hàng thường có hình dạng hoặc thành phần cụ thể mang lại cho chúng những khả năng mới đối với tự nhiên. Từ các loại thuốc có tác dụng lâu dài và vắc xin dựa trên protein đến nhiên liệu sinh học xanh hơn và ăn nhựa protein, lĩnh vực này đang nhanh chóng trở thành một công nghệ biến đổi.

Thiết kế protein tùy chỉnh phụ thuộc vào kỹ thuật học sâu. Với các mô hình ngôn ngữ lớn—AI đằng sau bom tấn ChatGPT của OpenAI—mơ ra hàng triệu cấu trúc ngoài sức tưởng tượng của con người, thư viện các protein thiết kế có hoạt tính sinh học sẽ nhanh chóng mở rộng.

“Nó mang lại sức mạnh to lớn,” Tiến sĩ Neil King tại Đại học Washington gần đây nói với Thiên nhiên. “Những điều mà một năm rưỡi trước là không thể—bây giờ bạn chỉ việc làm thôi.”

Tuy nhiên, với sức mạnh to lớn sẽ có trách nhiệm lớn lao. Khi các protein được thiết kế mới ngày càng thu hút được sự chú ý để sử dụng trong y học và kỹ thuật sinh học, các nhà khoa học hiện đang tự hỏi: Điều gì sẽ xảy ra nếu những công nghệ này được sử dụng cho mục đích bất chính?

Một bài tiểu luận gần đây trong Khoa học nhấn mạnh sự cần thiết của an toàn sinh học đối với các protein thiết kế. Tương tự như các cuộc thảo luận đang diễn ra về sự an toàn của AI, các tác giả cho biết đã đến lúc xem xét các chính sách và rủi ro về an toàn sinh học để các protein tùy chỉnh không bị lừa đảo.

Bài luận được viết bởi hai chuyên gia trong lĩnh vực này. Một, Tiến sĩ David Baker, giám đốc của Viện thiết kế protein tại Đại học Washington, đã dẫn đầu sự phát triển của RoseTTAFold—một thuật toán đã giải quyết vấn đề kéo dài nửa thập kỷ về giải mã cấu trúc protein chỉ từ các chuỗi axit amin của nó. Người còn lại, Tiến sĩ George Church tại Trường Y Harvard, là người tiên phong trong kỹ thuật di truyền và sinh học tổng hợp.

Họ đề xuất rằng các protein tổng hợp cần có mã vạch được nhúng vào trình tự di truyền của mỗi protein mới. Nếu bất kỳ protein thiết kế nào trở thành mối đe dọa—chẳng hạn như có khả năng gây ra một đợt bùng phát nguy hiểm—mã vạch của nó sẽ giúp chúng ta dễ dàng truy tìm nguồn gốc của nó.

Về cơ bản, hệ thống này cung cấp “dấu vết kiểm tra”, bộ đôi viết.

Thế giới va chạm

Các protein thiết kế gắn bó chặt chẽ với AI. Các chính sách an toàn sinh học tiềm năng cũng vậy.

Hơn một thập kỷ trước, phòng thí nghiệm của Baker đã sử dụng phần mềm để thiết kế và tạo ra một loại protein có tên Top7. Protein được tạo thành từ các khối xây dựng gọi là axit amin, mỗi khối được mã hóa bên trong DNA của chúng ta. Giống như các hạt trên một sợi dây, các axit amin sau đó được xoắn và nhăn thành các hình dạng 3D cụ thể, thường liên kết chặt chẽ hơn với nhau thành các cấu trúc phức tạp hỗ trợ chức năng của protein.

Top7 không thể “nói chuyện” với các thành phần tế bào tự nhiên – nó không có bất kỳ tác dụng sinh học nào. Nhưng ngay cả khi đó, đội kết luận rằng việc thiết kế các protein mới giúp có thể khám phá “các vùng rộng lớn của vũ trụ protein chưa được quan sát thấy trong tự nhiên”.

Nhập AI. Gần đây, nhiều chiến lược đã được triển khai để thiết kế các protein mới ở tốc độ siêu thanh so với công việc trong phòng thí nghiệm truyền thống.

Một là AI dựa trên cấu trúc tương tự như các công cụ tạo hình ảnh như DALL-E. Các hệ thống AI này được đào tạo về dữ liệu nhiễu và học cách loại bỏ nhiễu để tìm ra cấu trúc protein thực tế. Được gọi là mô hình khuếch tán, chúng dần dần tìm hiểu các cấu trúc protein tương thích với sinh học.

Một chiến lược khác dựa vào các mô hình ngôn ngữ lớn. Giống như ChatGPT, các thuật toán nhanh chóng tìm ra mối liên hệ giữa các “từ” protein và chắt lọc những kết nối này thành một loại ngữ pháp sinh học. Các chuỗi protein mà mô hình này tạo ra có khả năng gấp lại thành các cấu trúc mà cơ thể có thể giải mã được. Một ví dụ là ProtGPT2, trong đó kỹ sư có thể các protein hoạt động có hình dạng có thể tạo ra các đặc tính mới.

Kỹ thuật số đến vật lý

Các chương trình thiết kế protein AI này đang gióng lên hồi chuông cảnh báo. Protein là nền tảng của sự sống – những thay đổi có thể làm thay đổi đáng kể cách tế bào phản ứng với thuốc, vi rút hoặc các mầm bệnh khác.

Năm ngoái, các chính phủ trên thế giới đã công bố kế hoạch giám sát an toàn AI. Công nghệ này không được coi là mối đe dọa. Thay vào đó, các nhà lập pháp thận trọng đưa ra các chính sách nhằm đảm bảo nghiên cứu tuân theo luật về quyền riêng tư và hỗ trợ nền kinh tế, sức khỏe cộng đồng và quốc phòng. Dẫn đầu về trách nhiệm, Liên minh châu Âu đã đồng ý về Đạo luật AI hạn chế công nghệ trong một số lĩnh vực nhất định.

Protein tổng hợp không được nêu trực tiếp trong quy định. Baker và Church viết: Đó là tin tuyệt vời cho việc tạo ra các protein thiết kế, vốn có thể bị cản trở bởi các quy định hạn chế quá mức. Tuy nhiên, luật AI mới đang được xây dựng, với cơ quan cố vấn của Liên Hợp Quốc về AI sẽ chia sẻ các hướng dẫn về AI. quy định quốc tế vào giữa năm nay.

Bởi vì các hệ thống AI được sử dụng để tạo ra các protein thiết kế có tính chuyên môn hóa cao nên chúng vẫn có thể hoạt động dưới tầm kiểm soát của cơ quan quản lý—nếu lĩnh vực này thống nhất trong nỗ lực toàn cầu để tự điều chỉnh.

Tại Hội nghị thượng đỉnh về an toàn AI năm 2023Trong cuộc thảo luận về thiết kế protein hỗ trợ AI, các chuyên gia đã đồng ý rằng việc ghi lại DNA cơ bản của mỗi protein mới là chìa khóa. Giống như các protein tự nhiên, các protein thiết kế cũng được tạo ra từ mã di truyền. Việc ghi nhật ký tất cả các chuỗi DNA tổng hợp vào cơ sở dữ liệu có thể giúp dễ dàng phát hiện các dấu hiệu cảnh báo về các thiết kế có khả năng gây hại - ví dụ: nếu một protein mới có cấu trúc tương tự như các cấu trúc gây bệnh đã biết.

An toàn sinh học không ngăn chặn việc chia sẻ dữ liệu. Hợp tác là rất quan trọng đối với khoa học, nhưng các tác giả thừa nhận việc bảo vệ bí mật thương mại vẫn cần thiết. Và giống như trong AI, một số protein được thiết kế có thể hữu ích nhưng lại quá nguy hiểm nếu chia sẻ một cách công khai.

Một cách giải quyết câu hỏi hóc búa này là bổ sung trực tiếp các biện pháp an toàn vào chính quá trình tổng hợp. Ví dụ, các tác giả đề xuất thêm một mã vạch—được tạo từ các chữ cái DNA ngẫu nhiên—vào mỗi chuỗi di truyền mới. Để tạo ra protein, một máy tổng hợp sẽ tìm kiếm trình tự DNA của nó và chỉ khi tìm thấy mã thì nó mới bắt đầu tạo ra protein.

Nói cách khác, các nhà thiết kế ban đầu của protein có thể chọn người để chia sẻ quá trình tổng hợp - hoặc có chia sẻ nó hay không - trong khi vẫn có thể mô tả kết quả của họ trong các ấn phẩm.

Chiến lược mã vạch liên kết việc tạo ra protein mới với máy tổng hợp cũng sẽ tăng cường bảo mật và ngăn chặn các tác nhân xấu, gây khó khăn cho việc tái tạo các sản phẩm nguy hiểm tiềm tàng.

Các tác giả viết: “Nếu một mối đe dọa sinh học mới xuất hiện ở bất cứ đâu trên thế giới, các chuỗi DNA liên quan có thể được truy tìm nguồn gốc của chúng”.

Đó sẽ là một con đường khó khăn. Các tác giả viết: Sự an toàn của protein thiết kế sẽ phụ thuộc vào sự hỗ trợ toàn cầu từ các nhà khoa học, tổ chức nghiên cứu và chính phủ. Tuy nhiên, đã có những thành công trước đó. Các nhóm toàn cầu đã thiết lập các nguyên tắc chia sẻ và an toàn trong các lĩnh vực gây tranh cãi khác, chẳng hạn như nghiên cứu tế bào gốc, kỹ thuật di truyền, cấy ghép não và AI. Mặc dù không phải lúc nào cũng tuân theo—Trẻ sơ sinh CRISPR là một ví dụ khét tiếng—phần lớn các hướng dẫn quốc tế này đã giúp thúc đẩy nghiên cứu tiên tiến theo cách an toàn và công bằng.

Đối với Baker và Church, các cuộc thảo luận cởi mở về an toàn sinh học sẽ không làm chậm lĩnh vực này. Đúng hơn, nó có thể tập hợp các lĩnh vực khác nhau và thu hút sự thảo luận của công chúng để thiết kế protein tùy chỉnh có thể phát triển hơn nữa.

Ảnh: Đại học Washington

tại chỗ_img

Tin tức mới nhất

tại chỗ_img