Logo Zephyrnet

Một công cụ AI vừa tiết lộ gần 200 hệ thống mới để chỉnh sửa gen CRISPR

Ngày:

CRISPR có một vấn đề: sự xấu hổ về sự giàu có.

Kể từ khi hệ thống chỉnh sửa gen trở nên nổi tiếng, các nhà khoa học đã tìm kiếm các biến thể có độ chính xác và độ chính xác cao hơn.

Một phương pháp tìm kiếm sàng lọc các gen liên quan đến CRISPR-Cas9 trong DNA của vi khuẩn và các sinh vật khác. Một thành phần CRISPR khác tiến hóa nhân tạo trong phòng thí nghiệm để mang lại cho chúng các đặc tính trị liệu tốt hơn – như độ ổn định, an toàn và hiệu quả cao hơn bên trong cơ thể con người.

Dữ liệu này được lưu trữ trong cơ sở dữ liệu chứa hàng tỷ trình tự di truyền. Mặc dù có thể có các hệ thống CRISPR kỳ lạ ẩn trong các thư viện này nhưng đơn giản là có quá nhiều mục để tìm kiếm.

Trong tháng này, một nhóm tại MIT và Harvard do Tiến sĩ Feng Zhang, người tiên phong về CRISPR dẫn đầu, đã lấy cảm hứng từ cách tiếp cận dữ liệu lớn hiện có và sử dụng AI để thu hẹp biển trình tự di truyền thành một số ít tương tự như các hệ thống CRISPR đã biết.

AI đã lùng sục các cơ sở dữ liệu nguồn mở với bộ gen của các vi khuẩn không phổ biến, bao gồm cả những bộ gen được tìm thấy trong các nhà máy bia, mỏ than, bờ biển Nam Cực lạnh giá và (không đùa đâu) nước bọt của chó.

Chỉ trong vài tuần, thuật toán đã xác định chính xác hàng nghìn “bộ phận” sinh học mới tiềm năng có thể tạo nên 188 hệ thống dựa trên CRISPR mới, trong đó có một số hệ thống cực kỳ hiếm.

Một số ứng cử viên mới nổi bật. Ví dụ, một số có thể khóa chính xác hơn vào gen mục tiêu để chỉnh sửa với ít tác dụng phụ hơn. Các biến thể khác không thể sử dụng trực tiếp nhưng có thể cung cấp cái nhìn sâu sắc về cách thức hoạt động của một số hệ thống CRISPR hiện có, ví dụ như những hệ thống nhắm mục tiêu RNA, phân tử “sứ giả” chỉ đạo các tế bào tạo ra protein từ DNA.

“Đa dạng sinh học là một kho báu” nói Trương. “Thực hiện kiểu phân tích này cho phép chúng tôi giết hai con chim bằng một hòn đá: vừa nghiên cứu sinh học vừa có khả năng tìm thấy những điều hữu ích,” ông thêm.

Một cuộc săn hoang dã

Mặc dù CRISPR được biết đến với khả năng chỉnh sửa gen ở người nhưng các nhà khoa học lần đầu tiên phát hiện ra hệ thống này ở vi khuẩn giúp nó chống lại sự lây nhiễm virus.

Các nhà khoa học từ lâu đã thu thập các mẫu vi khuẩn từ các ngóc ngách trên toàn cầu. Nhờ giải trình tự DNA ngày càng có giá cả phải chăng và hiệu quả, nhiều mẫu trong số này—một số mẫu từ những nguồn không mong đợi như váng ao—đã được lập bản đồ di truyền và gửi vào cơ sở dữ liệu.

Zhang không lạ gì với việc săn lùng các hệ thống CRISPR mới. “Một vài năm trước, chúng tôi bắt đầu đặt câu hỏi, 'Ngoài CRISPR còn có gì nữa, và ngoài tự nhiên còn có những hệ thống lập trình RNA nào khác không?'" Zhang nói với Tin tức MIT đầu năm nay.

CRISPR được tạo thành từ hai cấu trúc. Một là chuỗi RNA hướng dẫn “chó săn”, thường dài khoảng 20 base, nhắm vào một gen cụ thể. Loại còn lại là protein Cas giống như chiếc kéo. Khi ở trong tế bào, chó săn sẽ tìm thấy mục tiêu và chiếc kéo sẽ cắt gen. Các phiên bản mới hơn của hệ thống, chẳng hạn như chỉnh sửa cơ sở hoặc chỉnh sửa chính, sử dụng các loại protein Cas khác nhau để thực hiện hoán đổi DNA một chữ cái hoặc thậm chí chỉnh sửa các mục tiêu RNA.

Trở lại trong 2021, Phòng thí nghiệm của Zhang đã truy tìm nguồn gốc của cây gia phả CRISPR, xác định một dòng họ hoàn toàn mới. Được gọi là OMEGA, các hệ thống này sử dụng RNA dẫn hướng nước ngoài và kéo protein, nhưng chúng vẫn có thể dễ dàng cắt DNA trong tế bào người được nuôi cấy trong đĩa petri.

Gần đây hơn, đội mở rộng tìm kiếm của họ sang một nhánh mới của sự sống: sinh vật nhân chuẩn. Các thành viên trong họ này—bao gồm thực vật, động vật và con người—có DNA được bọc chặt bên trong cấu trúc giống như hạt. Ngược lại, vi khuẩn không có những cấu trúc này. Bằng cách sàng lọc nấm, tảo và trai (đúng vậy, đa dạng sinh học thật kỳ lạ và tuyệt vời), nhóm nghiên cứu đã tìm thấy các protein mà họ gọi là Fanzors có thể được lập trình lại để chỉnh sửa DNA của con người - bằng chứng đầu tiên cho thấy cơ chế giống CRISPR cũng tồn tại ở sinh vật nhân chuẩn.

Nhưng mục tiêu không phải là săn lùng những người chỉnh sửa gen mới, sáng bóng chỉ vì mục đích đó. Đúng hơn, đó là khai thác khả năng chỉnh sửa gen của tự nhiên để xây dựng một bộ sưu tập các trình chỉnh sửa gen, mỗi trình chỉnh sửa có thế mạnh riêng, có thể điều trị các rối loạn di truyền và giúp chúng ta hiểu được hoạt động bên trong cơ thể.

Nói chung, các nhà khoa học đã phát hiện ra sáu hệ thống CRISPR chính, chẳng hạn như một số hệ thống cộng tác với các enzyme Cas khác nhau, trong khi một số khác chuyên về DNA hoặc RNA.

“Thiên nhiên thật tuyệt vời. Có rất nhiều sự đa dạng,” Zhang nói. “Có lẽ có nhiều hệ thống có thể lập trình RNA hơn và chúng tôi đang tiếp tục khám phá và hy vọng sẽ khám phá được nhiều hơn nữa.”

Scrabble kỹ thuật sinh học

Đó là những gì nhóm đã xây dựng AI mới, được gọi là FLSHclust, để thực hiện. Họ đã biến đổi công nghệ phân tích các tập dữ liệu lớn đến mức đáng kinh ngạc—như phần mềm nêu bật những điểm tương đồng trong các tệp tài liệu, âm thanh hoặc hình ảnh lưu trữ lớn—thành một công cụ để truy tìm các gen liên quan đến CRISPR.

Sau khi hoàn tất, thuật toán sẽ phân tích trình tự gen của vi khuẩn và thu thập chúng thành các nhóm—giống như việc nhóm các màu thành cầu vồng, nhóm các màu tương tự lại với nhau để bạn dễ dàng tìm thấy sắc thái mà mình mong muốn hơn. Từ đây, nhóm nghiên cứu đã tập trung vào các gen liên quan đến CRISPR.

Thuật toán đã tìm kiếm thông qua nhiều cơ sở dữ liệu nguồn mở bao gồm hàng trăm nghìn bộ gen từ vi khuẩn và vi khuẩn cổ cũng như hàng triệu chuỗi DNA bí ẩn. Tổng cộng, nó quét hàng tỷ gen mã hóa protein và nhóm chúng thành khoảng 500 triệu cụm. Trong đó, nhóm nghiên cứu đã xác định được 188 gen chưa có ai liên quan đến CRISPR và điều đó có thể tạo nên hàng nghìn hệ thống CRISPR mới.

Hai hệ thống, được phát triển từ vi khuẩn trong ruột của động vật và biển Đen, đã sử dụng RNA dẫn hướng 32 base thay vì 20 base thông thường được sử dụng trong CRISPR-Cas9. Giống như một truy vấn tìm kiếm, càng dài thì kết quả càng chính xác. Những “truy vấn” RNA hướng dẫn dài hơn này cho thấy hệ thống có thể có ít tác dụng phụ hơn. Một hệ thống khác giống như hệ thống chẩn đoán dựa trên CRISPR trước đó được gọi là CHIA SẺ, có thể nhanh chóng cảm nhận được một phân tử DNA hoặc RNA từ kẻ xâm lược truyền nhiễm.

Khi thử nghiệm trên tế bào người được nuôi cấy, cả hai hệ thống đều có thể cắt một chuỗi gen mục tiêu và chèn các chuỗi gen nhỏ với hiệu suất khoảng 13%. Nghe có vẻ không nhiều nhưng đó là mức cơ bản có thể được cải thiện.

Nhóm nghiên cứu cũng phát hiện ra các gen của hệ thống CRISPR mới nhắm vào RNA mà trước đây khoa học chưa biết đến. Chỉ được tìm thấy sau khi xem xét kỹ lưỡng, có vẻ như phiên bản này và bất kỳ phiên bản nào chưa được phát hiện đều không dễ dàng bị bắt giữ bởi các mẫu vi khuẩn trên khắp thế giới và do đó cực kỳ hiếm trong tự nhiên.

“Một số hệ vi sinh vật này chỉ được tìm thấy trong nước từ các mỏ than,” nói tác giả nghiên cứu Tiến sĩ Soumya Kannan. “Nếu ai đó không quan tâm đến điều đó, chúng tôi có thể chưa bao giờ nhìn thấy những hệ thống đó.”

Vẫn còn quá sớm để biết liệu những hệ thống này có thể được sử dụng trong chỉnh sửa gen người hay không. Ví dụ, những thiết bị cắt DNA ngẫu nhiên sẽ vô dụng cho mục đích điều trị. Tuy nhiên, AI có thể khai thác một vũ trụ dữ liệu di truyền rộng lớn để tìm ra các chuỗi gen “kỳ lân” tiềm năng và hiện có sẵn cho các nhà khoa học khác khám phá thêm.

Ảnh: NIH

tại chỗ_img

Tin tức mới nhất

tại chỗ_img