제퍼넷 로고

AI 도구가 CRISPR 유전자 편집을 위한 약 200개의 새로운 시스템을 공개했습니다.

시간

CRISPR에는 문제가 있습니다. 부를 당혹스럽게 만드는 것입니다.

유전자 편집 시스템이 큰 인기를 얻은 이후로 과학자들은 더 정확하고 정밀한 변종을 찾고 있습니다.

한 가지 검색 방법은 박테리아 및 기타 생물의 DNA에서 CRISPR-Cas9와 관련된 유전자를 스크리닝합니다. 또 다른 제품은 실험실에서 CRISPR 구성 요소를 인위적으로 진화시켜 인체 내부의 안정성, 안전성 및 효율성 향상과 같은 더 나은 치료 특성을 제공합니다.

이 데이터는 수십억 개의 유전자 서열을 포함하는 데이터베이스에 저장됩니다. 이러한 라이브러리에 이국적인 CRISPR 시스템이 숨겨져 있을 수 있지만 검색할 항목이 너무 많습니다.

이번 달 CRISPR의 선구자인 Feng Zhang 박사가 이끄는 MIT와 하버드 팀은 기존 빅 데이터 접근 방식에서 영감을 얻어 AI를 사용하여 알려진 CRISPR 시스템과 유사한 소수의 유전자 서열을 좁혔습니다.

AI 양조장, 탄광, 추운 남극 해안 및 (농담이 아닌) 개 타액에서 발견되는 박테리아를 포함하여 흔하지 않은 박테리아의 게놈으로 오픈 소스 데이터베이스를 샅샅이 뒤졌습니다.

단 몇 주 만에 알고리즘은 매우 희귀한 일부를 포함하여 188개의 새로운 CRISPR 기반 시스템을 구성할 수 있는 수천 개의 잠재적인 새로운 생물학적 "부품"을 찾아냈습니다.

몇몇 새로운 후보들이 눈에 띄었습니다. 예를 들어, 일부는 부작용이 적은 편집을 위해 표적 유전자를 보다 정확하게 고정할 수 있습니다. 다른 변형은 직접 사용할 수는 없지만 일부 기존 CRISPR 시스템이 어떻게 작동하는지에 대한 통찰력을 제공할 수 있습니다. 예를 들어 세포가 DNA에서 단백질을 만들도록 지시하는 "메신저" 분자인 RNA를 표적으로 하는 시스템이 있습니다.

“생물다양성은 정말 보물창고입니다.” 말했다 장. "이러한 분석을 수행하면 일석이조가 됩니다. 생물학을 연구하고 잠재적으로 유용한 것을 찾을 수도 있습니다."라고 그는 말했습니다. 추가.

와일드 헌트

CRISPR는 인간의 유전자 편집 능력으로 잘 알려져 있지만, 과학자들은 바이러스 감염과 싸우는 박테리아에서 이 시스템을 처음 발견했습니다.

과학자들은 오랫동안 전 세계 구석구석에서 박테리아 샘플을 수집해 왔습니다. 점점 저렴해지고 효율적인 DNA 시퀀싱 덕분에 이러한 샘플 중 다수(일부는 연못 쓰레기와 같은 예상치 못한 출처에서 나온 것)의 유전자 청사진이 작성되어 데이터베이스에 보관되었습니다.

Zhang은 새로운 CRISPR 시스템을 찾는 데 낯선 사람이 아닙니다. "몇 년 전, 우리는 'CRISPR 외에 무엇이 있고 자연계에 다른 RNA 프로그래밍 가능 시스템이 있습니까?'라고 묻기 시작했습니다." 이야기 MIT 뉴스 올해 초.

CRISPR는 두 가지 구조로 구성됩니다. 하나는 특정 유전자를 표적으로 하는 "블러드하운드(bloodhound)" 가이드 RNA 서열로, 일반적으로 약 20개 염기 길이입니다. 다른 하나는 가위 모양의 Cas 단백질입니다. 세포 안으로 들어가면 블러드하운드는 표적을 찾고 가위는 유전자를 잘라냅니다. 기본 편집 또는 프라임 편집, 다양한 유형의 Cas 단백질을 사용하여 단일 문자 DNA 교환을 수행하거나 심지어 RNA 표적을 편집할 수도 있습니다.

위로 2021에서, Zhang의 연구실은 CRISPR 가계도의 기원을 추적하여 완전히 새로운 가계도를 식별했습니다. 오메가(OMEGA)라고 불리는 이 시스템은 외부 가이드 RNA와 단백질 가위를 사용하지만 페트리 접시에서 배양된 인간 세포의 DNA를 쉽게 잘라낼 수 있습니다.

최근에는 팀 검색 범위를 넓혔습니다 생명의 새로운 분야: 진핵생물. 식물, 동물, 인간을 포함하여 이 가족의 구성원은 견과류 같은 구조 안에 DNA가 단단히 싸여 있습니다. 대조적으로 박테리아는 이러한 구조를 가지고 있지 않습니다. 곰팡이, 조류, 조개(예, 생물 다양성은 이상하고 굉장합니다)를 검사함으로써 팀은 인간 DNA를 편집하기 위해 재프로그래밍될 수 있는 Fanzors라고 불리는 단백질을 발견했습니다. 이는 CRISPR와 유사한 메커니즘이 진핵생물에도 존재한다는 첫 번째 증거입니다.

그러나 목표는 단지 ​​목적을 위해 훌륭하고 새로운 유전자 편집자를 찾는 것이 아닙니다. 오히려 자연의 유전자 편집 능력을 활용하여 각각 고유한 장점을 지닌 유전자 편집자 모음을 구축하여 유전 질환을 치료하고 우리 몸의 내부 작용을 이해하는 데 도움을 주는 것입니다.

과학자들은 총체적으로 XNUMX가지 주요 CRISPR 시스템을 발견했습니다. 일부는 다른 Cas 효소와 협력하고 다른 일부는 DNA 또는 RNA를 전문으로 합니다.

“자연은 놀랍습니다. 다양성이 너무 많아요.” Zhang 말했다. "아마도 더 많은 RNA 프로그래밍 가능 시스템이 있을 것입니다. 우리는 계속해서 탐구하고 있으며 더 많은 것을 발견할 수 있기를 바랍니다."

생명공학 스크래블

이것이 바로 팀이 FLSHclust라는 새로운 AI를 구축한 이유입니다. 그들은 문서, 오디오 또는 이미지 파일의 대량 저장에서 유사성을 강조하는 소프트웨어와 같이 어리둥절할 정도로 큰 데이터 세트를 분석하는 기술을 CRISPR와 관련된 유전자를 사냥하는 도구로 전환했습니다.

완료되면 알고리즘은 박테리아의 유전자 서열을 분석하여 그룹으로 수집했습니다. 이는 색상을 무지개로 클러스터링하고 유사한 색상을 그룹화하여 원하는 색상을 더 쉽게 찾을 수 있도록 하는 것과 비슷합니다. 여기에서 팀은 CRISPR와 관련된 유전자를 연구했습니다.

이 알고리즘은 박테리아와 고세균의 수십만 개의 게놈과 수백만 개의 미스터리 DNA 서열을 포함하는 여러 오픈 소스 데이터베이스를 샅샅이 뒤졌습니다. 전체적으로 수십억 개의 단백질 코딩 유전자를 스캔하여 대략 500억 개의 클러스터로 그룹화했습니다. 여기에서 팀은 아직 아무도 CRISPR와 연관시키지 않았으며 수천 개의 새로운 CRISPR 시스템을 구성할 수 있는 188개의 유전자를 식별했습니다.

미생물로부터 개발된 두 가지 시스템 배짱 동물과 흑해, CRISPR-Cas32에서 사용되는 일반적인 20개 염기 가이드 RNA 대신 9개 염기 가이드 RNA를 사용했습니다. 검색어와 마찬가지로 길이가 길수록 결과가 더 정확해집니다. 이러한 더 긴 가이드 RNA "쿼리"는 시스템이 부작용이 더 적을 수 있음을 시사합니다. 또 다른 시스템은 이전의 CRISPR 기반 진단 시스템과 같습니다. 셜록이는 감염성 침입자로부터 단일 DNA 또는 RNA 분자를 빠르게 감지할 수 있습니다.

배양된 인간 세포에서 테스트했을 때 두 시스템 모두 표적 유전자의 단일 가닥을 잘라내고 약 13%의 효율로 작은 유전자 서열을 삽입할 수 있었습니다. 별것 아닌 것 같지만 개선할 수 있는 기준입니다.

연구팀은 또한 이전에 과학에 알려지지 않은 RNA를 표적으로 하는 새로운 CRISPR 시스템에 대한 유전자를 발견했습니다. 면밀한 조사 후에야 발견된 이 버전과 아직 발견되지 않은 것들은 전 세계의 샘플링 박테리아로 쉽게 포착되지 않으므로 자연적으로 극히 드뭅니다.

"이러한 미생물 시스템 중 일부는 탄광의 물에서만 발견되었습니다." 말했다 연구 저자 Soumya Kannan 박사. "만약 누군가가 그것에 관심이 없었다면 우리는 그런 시스템을 결코 보지 못했을 것입니다."

이러한 시스템이 인간 유전자 편집에 사용될 수 있는지 여부를 알기에는 아직 이르다. 예를 들어, DNA를 무작위로 자르는 것들은 치료 목적으로는 쓸모가 없습니다. 그러나 AI는 잠재적인 "유니콘" 유전자 서열을 찾기 위해 광대한 유전 데이터의 세계를 채굴할 수 있으며 이제 다른 과학자들이 추가 탐색을 위해 사용할 수 있습니다.

이미지 신용 : NIH

spot_img

최신 인텔리전스

spot_img