제퍼넷 로고

생성적 AI가 다음 전염병을 예측하는 데 어떻게 도움이 될 수 있습니까?

시간

바이러스는 빠르게 진화하는 놀라운 능력을 가지고 있습니다. 코로나19가 단적인 예이다. 바이러스가 베타에서 델타, 오미크론으로 변이되면서 전염병이 장기화되고 세계가 폐쇄되었습니다. 과학자들은 백신과 치료법을 새로운 변종에 맞게 조정하기 위해 안간힘을 썼습니다. 바이러스가 우위를 점했습니다. 우리는 따라잡기 게임을 하고 있었어요.

AI 하버드 대학에서 개발한 기술은 새로운 변종이 도착하기 전에 예측할 수 있게 함으로써 흐름을 바꿀 수 있습니다. EVEscape라고 불리는 AI는 바이러스 진화를 위한 일종의 기계 "오라클"입니다.

수집된 데이터에 대한 교육을 받았습니다. 전에 이 알고리즘은 코로나19의 빈번한 돌연변이와 문제가 되는 변종을 예측할 수 있었고 변종과 관련된 미래 목록도 생성했습니다. 도구의 핵심은 생성적 AI 모델입니다. DALL-E or ChatGPT그러나 여기에는 바이러스 돌연변이를 더 잘 반영하기 위해 신중하게 선택된 몇 가지 생물학적 요인이 포함됩니다.

이 도구는 코로나19 전용으로 제작된 것이 아닙니다. 또한 독감 바이러스, HIV 및 미래의 전염병을 촉발할 수 있는 두 가지 연구가 덜 된 바이러스의 변종을 정확하게 예측합니다.

"우리는 바이러스의 변종을 예측하고 새로운 변종을 예측할 수 있는지 알고 싶습니다." 말했다 하버드 의과대학 Blavatnik 연구소에서 연구를 주도한 Debora Marks 박사. "우리가 할 수 있다면 그것은 백신과 치료법을 설계하는 데 매우 중요할 것이기 때문입니다."

팬데믹의 급성 단계에서 AI를 사용하여 바이러스 돌연변이를 예측하려는 강력한 추진이 있었습니다. 유용하기는 하지만 대부분의 모델은 기존 변형에 대한 정보에 의존했으며 단기 예측만 생성할 수 있었습니다.

이와 대조적으로 EVEscape는 진화 유전체학을 사용하여 바이러스의 조상을 엿보므로 더 긴 예측이 가능하고 잠재적으로 미리 계획하고 대응할 수 있는 충분한 시간이 있습니다.

연구 저자인 누르 유세프(Noor Youssef) 박사는 “우리는 미래에 대비한 백신과 치료법을 실제로 어떻게 설계할 수 있는지 알아내고 싶다”고 말했습니다.

진화하다 진화하다

바이러스는 자연 선택의 압력에 극도로 적응할 수 있지만 여전히 다른 생물처럼 진화합니다. 그들의 유전 물질은 무작위로 돌연변이를 일으킵니다. 일부 돌연변이는 숙주를 감염시키는 능력을 감소시킵니다. 다른 것들은 증식하기 전에 숙주를 죽입니다. 그러나 때때로 바이러스는 벌레가 산불처럼 번식하고 퍼질 수 있을 만큼 호스트의 건강을 유지하는 Goldilocks 변종을 발견합니다. 바이러스의 생존에는 좋지만, 이러한 변종은 코로나19의 경우처럼 인류에게 세계적인 재앙을 촉발합니다.

과학자들은 오랫동안 바이러스 돌연변이와 그 영향을 예측하려고 노력해 왔습니다. 불행하게도 가능한 모든 돌연변이를 예측하는 것은 불가능합니다. 일반적인 코로나바이러스에는 대략 30,000개의 유전 문자가 있습니다. 잠재적인 변형의 수가 모든 변형의 수보다 많습니다. 소립자—즉, 전자, 쿼크 및 기타 기본 입자 —우주에서.

새로운 연구에서는 보다 실용적인 솔루션을 확대했습니다. 각 변형을 매핑하는 것을 잊어버리세요. 제한된 데이터로 위험한 것까지 예측할 수 있을까요?

악당 놀이를 해보자

팀은 다음으로 향했습니다. 이브, 이전에 인간의 질병을 유발하는 유전적 변이를 추적하기 위해 개발된 AI입니다. 알고리즘의 핵심에는 인간의 전문 지식에만 의존하지 않고도 단백질 기능을 예측할 수 있는 심층 생성 모델이 있습니다.

AI는 진화를 통해 배웠습니다. 과거를 엿보기 위해 호미닌 사촌의 골격을 비교하는 고고학자들처럼 AI는 종 전체에 걸쳐 단백질을 암호화하는 DNA 서열을 스크리닝했습니다. 전략 인간의 건강에 중요한 유전적 변이(예: 암이나 심장 문제와 관련된 변이)가 발견되었습니다.

"이러한 생성 모델을 사용하면 진화 정보로부터 놀라운 사실을 배울 수 있습니다. 데이터에는 공개할 수 있는 숨겨진 비밀이 있습니다." 말했다 점수.

새로운 연구에서는 EVE를 재교육하여 바이러스의 유전적 변이를 예측했습니다. 그들은 첫 번째 개념 증명으로 코로나2의 배후에 있는 바이러스인 SARS-CoV-19를 사용했습니다.

핵심은 바이러스의 생물학적 요구를 AI의 데이터 세트에 통합하는 것이었습니다.

바이러스의 핵심 추진력은 생존입니다. 그들은 빠르게 돌연변이를 일으키며 때로는 백신이나 항체 치료를 회피할 수 있는 유전적 변화로 이어집니다. 그러나 동일한 돌연변이는 바이러스가 숙주를 붙잡고 번식하는 능력을 손상시킬 수 있으며 이는 명백한 단점입니다.

이러한 종류의 돌연변이를 배제하기 위해 AI는 대유행 이전에 발견된 광범위한 코로나바이러스(예: 원래 SARS 바이러스 및 "일반 감기" 바이러스)의 단백질 서열을 비교했습니다. 이 비교를 통해 바이러스 게놈의 어느 부분이 보존되는지 밝혀졌습니다. 이러한 유전적 청지기는 바이러스 생존의 기초입니다. 다른 코로나바이러스와 SARS-CoV-2는 공통된 유전적 조상을 공유하기 때문에 이러한 유전자에 대한 돌연변이는 생존 가능한 변종보다는 사망을 초래할 가능성이 높습니다.

이와 대조적으로 AI는 스파이크 단백질이 바이러스의 유연한 구성 요소로 진화할 가능성이 가장 높다고 예측했습니다. 바이러스 표면에 점재해 있는 이 단백질은 이미 백신과 항체 치료법의 표적이 되었습니다. 이러한 단백질의 변화는 현재 치료법의 효능을 낮출 수 있습니다.

미래로 귀환

전염병을 분석할 때 사후 통찰력은 20/20입니다. 그러나 우리가 다음 유행병을 싹에서 차단하려면 따라잡으려고 애쓰기보다는 앞으로 일어날 일을 미리 살펴보는 것이 필수적입니다.

AI의 예측 능력을 테스트하기 위해 팀은 예측을 GISAID(모든 인플루엔자 데이터 공유에 대한 글로벌 이니셔티브) 데이터베이스와 일치시켜 정확도를 측정했습니다. 이름에도 불구하고 데이터베이스에는 750,000개의 고유한 코로나바이러스 유전자 서열이 포함되어 있습니다.

EVEscape는 50년 2023월 현재 팬데믹 기간 동안 상위 예측 중 XNUMX%가 나타난 델타 및 오미크론과 같은 확산 가능성이 가장 높은 변종을 식별했습니다. 이전 머신러닝 방법에 따르면, EVEscape는 돌연변이를 예측하고 어떤 변이체가 항체 치료에서 벗어날 가능성이 가장 높은지 예측하는 데 두 배나 뛰어났습니다.

과거를 기억하다

EVEscape의 초강력은 다른 바이러스와 함께 사용할 수 있다는 것입니다. 코로나XNUMX는 지난 XNUMX년 동안 우리의 관심을 사로잡았습니다. 그러나 잘 알려지지 않은 바이러스는 침묵 속에 숨어 있습니다. 예를 들어 라사 바이러스와 니파 바이러스는 서아프리카와 서남아시아 국가에서 산발적으로 발생하며 전염병이 발생할 가능성이 있습니다. 바이러스는 항체로 치료할 수 있지만 빠르게 돌연변이가 발생합니다.

연구팀은 EVEscape를 사용하여 이미 항체를 회피하는 것으로 알려진 바이러스를 포함하여 이러한 바이러스의 탈출 돌연변이를 예측했습니다.

진화유전학과 AI를 결합한 이 연구는 “미래 성공의 열쇠는 과거를 기억하는 데 달려 있다”는 점을 보여준다. 말했다 박사. 이번 연구에 참여하지 않은 국립 생명공학 정보 센터 및 메릴랜드 국립 의학 도서관의 Nash D. Rochman과 Eugene V. Koonin.

EVEscape는 아직 알려지지 않은 바이러스라도 미래의 바이러스 변종을 예측할 수 있는 힘을 가지고 있습니다. 이는 전염병의 위험을 추정하여 잠재적으로 다음 발병보다 한 발 앞서 나갈 수 있도록 해줍니다.

팀은 이제 이 도구를 사용하여 다음 SARS-CoV-2 변종을 예측하고 있습니다. 그들은 격주로 돌연변이를 추적하고 각 변형의 잠재력 순위 지정 또 다른 Covid 물결을 촉발하기 위해. 데이터는 세계보건기구(WHO) 및 세계보건기구(WHO)와 공유됩니다. 코드는 공개적으로 사용 가능합니다.

Rochman과 Koonin에게 새로운 AI 툴킷은 다음 전염병을 막는 데 도움이 될 수 있습니다. 이제 우리는 “COVID-19가 인류 역사상 가장 파괴적인 전염병으로 영원히 알려지기를 바랍니다”라고 그들은 썼습니다.

이미지 제공: SARS-CoV2 바이러스 입자 / 국립 알레르기 및 전염병 연구소, NIH

spot_img

최신 인텔리전스

spot_img