Logo Zephyrnet

AI thiết kế protein mở ra cánh cửa cho thuốc chữa bệnh Con người không thể mơ tới

Ngày:

hình ảnh

Thiết kế một protein hơi giống như làm một cái tủ. Bước đầu tiên là xây dựng xương sống để giữ các protein lại với nhau. Nhưng sau đó đến phần khó khăn: tìm ra vị trí lắp đặt bản lề trên giàn giáo — nghĩa là, tìm “điểm nóng” tốt nhất —để đặt trên cửa, giá và các phụ kiện khác giúp tủ hoạt động đầy đủ.

Theo một cách nào đó, protein cũng có các điểm nóng được gắn trong cấu trúc của chúng. Đúng như tên gọi của chúng, “các vị trí chức năng”, những ngóc ngách hấp dẫn này tạo thành những bến đỗ phức tạp cho các protein hoặc thuốc khác bám vào. Các trang web là trung tâm để thực hiện hầu hết các quá trình sinh học cơ bản của chúng tôi. Họ cũng là một mỏ vàng khổng lồ để thiết kế các phương pháp điều trị và thuốc y tế mới.

Vấn đề? Các vị trí chức năng rất khó để lập bản đồ. Theo truyền thống, các nhà khoa học phải biến đổi từng vùng đáng ngờ trên protein - chuyển đổi axit amin này sang axit amin khác - để xác định các điểm liên kết chính xác. Giống như một thám tử sàng lọc hàng trăm nghi phạm, trong đó có thể có rất nhiều, nó cực kỳ tẻ nhạt.

A Nghiên cứu mới in Khoa học lật đổ toàn bộ sách trò chơi. Được dẫn dắt bởi Tiến sĩ David Baker tại Đại học Washington, một nhóm đã khai thác "trí tưởng tượng" của AI để mơ ước vô số các trang web chức năng từ đầu. Đó là khả năng “sáng tạo” tốt nhất của bộ óc máy - một thuật toán học sâu dự đoán khu vực chung của vị trí chức năng của protein, nhưng sau đó sẽ khắc sâu thêm cấu trúc.

Để kiểm tra thực tế, nhóm nghiên cứu đã sử dụng phần mềm mới để tạo ra các loại thuốc chống lại bệnh ung thư và thiết kế vắc xin chống lại các loại vi rút thông thường, nếu đôi khi gây chết người. Trong một trường hợp, bộ óc kỹ thuật số đã đưa ra một giải pháp mà khi được thử nghiệm trong các tế bào cô lập, nó phù hợp hoàn hảo với một loại kháng thể hiện có chống lại một loại vi rút thông thường. Nói cách khác, thuật toán đã “tưởng tượng” ra một điểm nóng từ một protein virus, khiến nó dễ bị tổn thương như một mục tiêu để thiết kế các phương pháp điều trị mới.

Thuật toán là bước đột phá đầu tiên của học sâu vào việc xây dựng các protein xung quanh các chức năng của chúng, mở ra cánh cửa cho các phương pháp điều trị mà trước đây không thể tưởng tượng được. Nhưng phần mềm không giới hạn ở các điểm nóng protein tự nhiên. “Các protein mà chúng ta tìm thấy trong tự nhiên là những phân tử tuyệt vời, nhưng các protein được thiết kế có thể làm được nhiều hơn thế,” Baker cho biết trong một thông cáo báo chí. Thuật toán là "làm những điều mà không ai trong chúng ta nghĩ rằng nó có thể làm được."

Điểm nóng Protein

Nhóm của Baker không lạ gì với việc dự đoán protein bằng trí óc nhân tạo. Vài năm trước, họ đã làm rung chuyển lĩnh vực sinh học cấu trúc bằng cách phát hành Rosetta, một phần mềm có thể dự đoán cấu trúc 3D của protein chỉ dựa trên trình tự axit amin của nó. Họ tiếp tục lập bản đồ các phức hợp protein và thiết kế các “tua vít” protein từ đầu để tách ra các tương tác protein không mong muốn. Cuối năm ngoái, họ đã phát hành một mạng lưới học tập sâu được đặt tên là trRosetta, một “kiến trúc sư” AI tổng quát hóa cách các chuỗi axit amin sắp xếp thành các cấu trúc phức tạp ở kích thước nano.

Hãy sao lưu.

Thật dễ dàng để hình dung protein như cánh gà nhiều thịt, gân guốc mà tôi đang cắn vào khi gõ câu này. Nhưng ở cấp độ phân tử, chúng thanh lịch hơn nhiều. Hãy tưởng tượng nhiều khối Lego — axit amin — được gắn với nhau bằng một sợi dây. Bây giờ xoay nó xung quanh, xoắn chuỗi cho đến khi một số khối dính vào nhau. Điều này tạo thành một cấu trúc mỏng manh thường giống như một tấm trải giường xoắn hoặc nhàu nhĩ. Trong một số protein, các khối xây dựng này tiếp tục tập hợp thành phức hợp — ví dụ, tạo ra một kênh dẫn xuyên qua màng bảo vệ của tế bào giống như một đường cao tốc liên tiểu bang được tuần tra.

Protein cung cấp năng lượng cho mọi quá trình sinh học đơn lẻ, thường thông qua một loạt các tương tác với các protein hoặc thuốc khác, tùy thuộc vào đối tác - có thể gây ra những hậu quả hoàn toàn khác nhau: một tế bào nên sống hay chết? Tấn công một kẻ xâm lược tiềm năng hoặc đứng xuống? Nói cách khác, protein là nền tảng của sự sống, và việc phân tích cấu trúc của chúng là cách chúng ta có thể xâm nhập vào cuộc sống.

Đây là vấn đề: không phải tất cả các phần của protein đều được tạo ra như nhau. Nếu một protein là cơ thể người, các vị trí chức năng là “bàn tay” của nó — nơi nó bám vào một protein hoặc thuốc khác, kích hoạt các phản ứng enzym hoặc chống lại các mầm bệnh xâm nhập. Được nhúng trực tiếp vào cấu trúc của protein, các vị trí này khó bị ghim lại và thậm chí khó tái tạo.

Nghiên cứu mới đã giải quyết vấn đề với một phiên bản của Rosetta: với một số kiến ​​thức trước đây, liệu máy tính có thể mơ một chuỗi axit amin gấp tự nhiên thành một vị trí chức năng không?

Người mơ mộng và Người hiện thực

Vấn đề có vẻ kỳ lạ, nhưng đã có một ví dụ trước đó — trong một lĩnh vực khác. Sử dụng mạng nơ-ron, OpenAI đã tạo ra một loạt các hình ảnh chỉ từ chú thích văn bản. Một phần phụ của trình tạo văn bản AI của rockstar GPT-3, thuật toán DALL · E đã tạo ra những hình ảnh tưởng tượng nhưng trông thực tế dựa trên các lời nhắc văn bản đơn giản bằng cách phát hiện các mẫu từ quá trình đào tạo của nó. "Nó lấy những chỗ sâu nhất, tăm tối nhất trong trí tưởng tượng của bạn và biến nó thành một thứ gì đó phù hợp một cách kỳ lạ" nói Tiến sĩ Hany Farid tại UC Berkeley sau khi phát hành ban đầu của công cụ.

Việc xây dựng một vị trí chức năng của protein cũng tương tự như vậy. Ở đây, các axit amin là các chữ cái và vị trí chức năng của protein là hình ảnh. “Ý tưởng là giống nhau: mạng nơ-ron có thể được đào tạo để xem các mẫu trong dữ liệu. Sau khi được đào tạo, bạn có thể đưa ra lời nhắc và xem liệu nó có thể tạo ra một giải pháp tốt hay không, ”Tiến sĩ Joseph Watson, tác giả chính của công trình mới cho biết. Ngoại trừ thay vì viết một cuốn tiểu thuyết, thuật toán có thể giúp viết lại cuộc sống.

Nhóm đã bắt đầu với một sáng tạo trước đó, trRosetta. Đó là một mạng lưới thần kinh ban đầu được thiết kế để tạo ra các protein mới dựa trên trình tự axit amin trong khi có thể dự đoán cấu trúc của chúng — một số khác lạ với các cấu trúc tự nhiên đến nỗi nhóm đã đặt tên cho hoạt động bên trong của deep learning là “ảo giác”. Thuật toán có vẻ hoàn hảo: nó có thể dự đoán cả trình tự axit amin của protein và cấu trúc của nó.

Nấc? Nó không thực sự hoạt động. Ngược lại, OG dự đoán cấu trúc protein, hoa hồngTTAgấp, biểu diễn như một nhà vô địch. Sức mạnh của thuật toán đến từ thiết kế của nó: mô hình hóa từng axit amin ở kích thước nano, cung cấp tọa độ cho từng nguyên tử. Giống như việc ghim một trang web địa lý bằng Google Maps, điều này cung cấp mức độ chân thực cho một cấu trúc mà AI có thể tiếp tục phát triển — một loại “ảo giác có hạn chế”.

Dịch? RoseTTAFold có thể dự đoán một cấu trúc chức năng — cụ thể cho vấn đề đang xảy ra — và đưa ra một bản phác thảo thô làm thiết kế cuối cùng.

Sau đó là một thủ thuật thông minh khác, được gọi là "inpainting." Ở đây, nhóm nghiên cứu đã giấu các phần của trình tự hoặc cấu trúc protein. Phần mềm này đã phải học cách giải mã thông tin từ những gì về cơ bản là đánh chặn vô tuyến ồn ào, nơi bạn chỉ có thể nghe một vài từ đầu tiên nhưng cố gắng hiểu ý nghĩa của nó bằng cách điền vào chỗ trống. RoseTTAFold đã giải quyết “vấn đề khôi phục thông tin bị thiếu” một cách thích thú, tự động hoàn thành cả trình tự và cấu trúc axit amin để xây dựng một vùng chức năng nhất định với độ trung thực cao.

RoseTTAFold có thể giải quyết các vấn đề xây dựng chuỗi axit amin và tạo xương sống cho trang web cùng một lúc. Nó giống như đặt các từ trên giấy: người viết đảm bảo mỗi chữ cái ở đúng vị trí, đồng thời kiểm tra xem ngữ pháp và ý nghĩa có hợp lý hay không.

Đặt câu hỏi về bản chất của thực tế

Đưa sáng tạo mới của họ vào thử nghiệm, nhóm đã tạo ra một số thiết kế thuốc và vắc-xin có khả năng chống lại vi rút và ung thư hoặc giúp giải quyết các vấn đề sức khỏe ít sắt.

Đối với tác giả chính, Tiến sĩ Jue Wang, thuật toán đã trở nên phù hợp một cách bất ngờ. Trong khi thực hiện dự án, cậu con trai hai tuổi của anh phải nhập viện cấp cứu vì nhiễm trùng phổi do RSV (Virus hợp bào hô hấp) —một loại virus thường có các triệu chứng giống như cảm lạnh, nhưng có thể gây chết người ở trẻ và người già.

Vào thời điểm đó, Wang đang sử dụng thuật toán để thiết kế các phương pháp điều trị mới, bao gồm các vị trí tiềm năng trên RSV để thử nghiệm thêm vắc xin và thuốc chống lại. Đó là một cấu trúc được lập bản đồ tương đối tốt. Phần mềm tạo ảo giác thiết kế tóm tắt hai vị trí cho vắc xin có khả năng liên kết với. Các thử nghiệm sử dụng các protein ảo giác, được tái tạo trong vi khuẩn, nhanh chóng bắt lấy các kháng thể hiện có — một dấu hiệu cho thấy chúng hoạt động và phương pháp học sâu hoạt động.

Sự việc “khiến tôi nhận ra rằng ngay cả những vấn đề 'kiểm tra' mà chúng tôi đang thực hiện cũng thực sự có ý nghĩa," Wang nói.

Trong một số thử nghiệm bổ sung, nhóm đã thiết kế các vị trí chức năng cho một loại enzyme, protein liên kết với protein và protein bám vào các ion kim loại — về cơ bản, cách bạn hấp thụ sắt và các kim loại quan trọng khác.

Mặc dù mạnh mẽ, nhưng vẫn có chỗ cho sự phát triển. Phương pháp này mở ra cánh cửa để làm sáng tỏ các protein tự nhiên, nhưng cũng có khả năng thiết kế những protein mới cho sinh học tổng hợp. Baker nói: “Đây là những cách tiếp cận mới rất hiệu quả, nhưng vẫn còn nhiều chỗ để cải thiện.

Nhìn chung, đó là một chiến thắng khác cho học sâu và giới thiệu hấp dẫn về cách AI và sinh học có thể kết hợp với nhau. Baker cho biết: “Dự đoán cấu trúc protein đã biến đổi trong học tập sâu trong hai năm qua, chúng tôi hiện đang ở giữa quá trình chuyển đổi thiết kế protein tương tự.

Tín dụng hình ảnh: Ian C. Haydon /Viện thiết kế protein của UW. Phần mềm trí tuệ nhân tạo mới được đào tạo về cấu trúc protein có thể tạo ra các protein chức năng, bao gồm cả những vắc xin ứng cử viên này cho virus đường hô hấp RSV, chỉ trong vài giây.

tại chỗ_img

Tin tức mới nhất

tại chỗ_img