Logo Zephyrnet

ForceGen: Sử dụng mô hình khuếch tán để giúp thiết kế các protein mới

Ngày:

Mặc dù protein chỉ được tạo thành từ một số lượng nhỏ các axit amin riêng biệt, nhưng sự đơn giản dễ hiểu này nhanh chóng biến mất khi xem xét nhiều trình tự có thể có trên một protein, chưa kể đến nhiều cách mà một trình tự protein 1D có thể gấp lại thành hình dạng protein 3D. với một chức năng cụ thể. Mặc dù quá trình tiến hóa tự nhiên đã thực hiện được phần lớn công việc ở đây, nhưng việc tìm ra các trình tự mới và chức năng của chúng là một nhiệm vụ khó khăn khi các thuật toán học sâu ngày càng được áp dụng. Như [Bo Ni] và đồng nghiệp báo cáo trong một bài báo nghiên cứu in Những tiến bộ khoa học, thử thách khó khăn nhất là thiết kế chuỗi protein dựa trên chức năng mong muốn. Sau đó, họ trình bày cách sử dụng mô hình tổng quát để tăng tốc quá trình này.

Họ bắt đầu thiết kế các protein có các đặc tính cơ học cụ thể, nhờ đó họ sử dụng các đặc tính mở rộng đã biết của các chuỗi protein khác nhau để huấn luyện một mô hình khuếch tán. Do đó, cách tiếp cận này gần giống với công nghệ đằng sau các thuật toán tạo hình ảnh như DALL-E hơn là LLM. Bằng cách sử dụng mô hình khuếch tán đã được huấn luyện, sau đó có thể tạo ra các chuỗi có khả năng mô phỏng các đặc tính, với kết quả khả quan.

Là một công cụ hỗ trợ tập hợp dữ liệu lớn, mô hình khuếch tán như vậy có thể rất hữu ích trong các lĩnh vực thậm chí ngoài quá trình tổng hợp protein, tự động hóa các nhiệm vụ tẻ nhạt và tăng tốc độ khám phá một cách có thể hình dung được.

tại chỗ_img

Tin tức mới nhất

tại chỗ_img