Mặc dù protein chỉ được tạo thành từ một số lượng nhỏ các axit amin riêng biệt, nhưng sự đơn giản dễ hiểu này nhanh chóng biến mất khi xem xét nhiều trình tự có thể có trên một protein, chưa kể đến nhiều cách mà một trình tự protein 1D có thể gấp lại thành hình dạng protein 3D. với một chức năng cụ thể. Mặc dù quá trình tiến hóa tự nhiên đã thực hiện được phần lớn công việc ở đây, nhưng việc tìm ra các trình tự mới và chức năng của chúng là một nhiệm vụ khó khăn khi các thuật toán học sâu ngày càng được áp dụng. Như [Bo Ni] và đồng nghiệp báo cáo trong một bài báo nghiên cứu in Những tiến bộ khoa học, thử thách khó khăn nhất là thiết kế chuỗi protein dựa trên chức năng mong muốn. Sau đó, họ trình bày cách sử dụng mô hình tổng quát để tăng tốc quá trình này.
Họ bắt đầu thiết kế các protein có các đặc tính cơ học cụ thể, nhờ đó họ sử dụng các đặc tính mở rộng đã biết của các chuỗi protein khác nhau để huấn luyện một mô hình khuếch tán. Do đó, cách tiếp cận này gần giống với công nghệ đằng sau các thuật toán tạo hình ảnh như DALL-E hơn là LLM. Bằng cách sử dụng mô hình khuếch tán đã được huấn luyện, sau đó có thể tạo ra các chuỗi có khả năng mô phỏng các đặc tính, với kết quả khả quan.
Là một công cụ hỗ trợ tập hợp dữ liệu lớn, mô hình khuếch tán như vậy có thể rất hữu ích trong các lĩnh vực thậm chí ngoài quá trình tổng hợp protein, tự động hóa các nhiệm vụ tẻ nhạt và tăng tốc độ khám phá một cách có thể hình dung được.
- Phân phối nội dung và PR được hỗ trợ bởi SEO. Được khuếch đại ngay hôm nay.
- PlatoData.Network Vertical Generative Ai. Trao quyền cho chính mình. Truy cập Tại đây.
- PlatoAiStream. Thông minh Web3. Kiến thức khuếch đại. Truy cập Tại đây.
- Trung tâmESG. Than đá, công nghệ sạch, Năng lượng, Môi trường Hệ mặt trời, Quản lý chất thải. Truy cập Tại đây.
- PlatoSức khỏe. Tình báo thử nghiệm lâm sàng và công nghệ sinh học. Truy cập Tại đây.
- nguồn: https://hackaday.com/2024/02/19/forcegen-using-a-diffusion-model-to-help-design-novel-proteins/