제퍼넷 로고

SARS-CoV-2 게놈의 포괄적 인지도

시간

2020 년 초, Covid-19 대유행이 시작된 지 몇 달 후 과학자들은 Covid-2 감염을 유발하는 바이러스 인 SARS-CoV-19의 전체 게놈을 시퀀싱 할 수있었습니다. 그 시점에서 많은 유전자가 이미 알려져 있었지만 단백질 코딩 유전자의 완전한 보완 물은 해결되지 않았습니다.

이제 광범위한 비교 게놈 연구를 수행 한 후 MIT 연구자들은 SARS-CoV-2 게놈의 가장 정확하고 완전한 유전자 주석이라고 설명하는 것을 생성했습니다. 오늘 나타나는 그들의 연구에서 자연 통신, 그들은 몇 가지 단백질 코딩 유전자를 확인했고 유전자로 제안 된 다른 몇 가지 유전자는 어떤 단백질도 코딩하지 않는다는 것을 발견했습니다.

이 연구의 선임 저자이자 MIT의 컴퓨터 과학 교수 인 Manolis Kellis는“우리는 진화 적 시그니처에이 강력한 비교 유전체학 접근 방식을 사용하여이 엄청나게 중요한 게놈의 진정한 기능적 단백질 코딩 내용을 발견 할 수있었습니다. 컴퓨터 과학 및 인공 지능 연구소 (CSAIL) 및 Broad Institute of MIT 및 Harvard의 회원입니다.

연구팀은 또한 인간을 감염시키기 시작한 이후 다른 SARS-CoV-2,000 분리주에서 발생한 거의 2 개의 돌연변이를 분석하여 이러한 돌연변이가 면역계를 회피하거나 더 감염 될 수있는 바이러스의 능력을 변화시키는 데 얼마나 중요한지 평가할 수 있도록했습니다. .

비교 유전체학

SARS-CoV-2 게놈은 거의 30,000 개의 RNA 염기로 구성됩니다. 과학자들은 관련 바이러스에서 발견되는 단백질 코딩 유전자와의 유사성을 기반으로 단백질 코딩 유전자를 코딩하는 것으로 알려진 여러 영역을 확인했습니다. 몇몇 다른 영역은 단백질을 암호화하는 것으로 의심되었지만, 단백질을 암호화하는 유전자로 확실히 분류되지 않았습니다.

연구진은 SARS-CoV-2 게놈의 어떤 부분에 실제로 유전자가 포함되어 있는지 확인하기 위해 유사한 바이러스의 게놈을 비교하는 비교 게놈이라는 유형의 연구를 수행했습니다. SARS-CoV-2 바이러스는 다음과 같은 바이러스의 아 속에 속합니다. 사베코바이러스, 대부분은 박쥐를 감염시킵니다. 연구진은 SARS-CoV-2, SARS-CoV (2003 년 SARS 발병을 일으켰 음), 박쥐 사르 베코 바이러스 42 종에 대한 분석을 수행했습니다.

Kellis는 이전에 이러한 유형의 분석을 수행하기위한 계산 기술을 개발했으며, 그의 팀은 인간 게놈 비교 다른 포유류의 게놈과 함께. 이 기술은 특정 DNA 또는 RNA 염기가 종간에 보존되는지 여부를 분석하고 시간에 따른 진화 패턴을 비교하는 데 기반을두고 있습니다.

이 기술을 사용하여 연구진은 모든 코로나 바이러스에서 잘 확립 된 2 개 외에 SARS-CoV-3 게놈에서 3 개의 단백질 코딩 유전자를 확인했습니다. 그들은 또한 ORF3a라는 유전자를 암호화하는 영역이 ORF2c라는 이름의 추가 유전자도 암호화한다는 것을 확인했습니다. 유전자는 ORFXNUMXa와 겹치지 만 다른 판독 프레임에서 발생하는 RNA 염기를 가지고 있습니다. 이 유전자 내 유전자는 대형 게놈에서는 드물지만 게놈이 압축 상태를 유지하기 위해 선택적인 압력을받는 많은 바이러스에서 흔합니다. 이 새로운 유전자와 다른 여러 SARS-CoV-XNUMX 유전자의 역할은 아직 알려지지 않았습니다.

연구진은 또한 가능한 유전자로 제안 된 XNUMX 개의 다른 영역이 기능성 단백질을 암호화하지 않는다는 것을 보여 주었으며 아직 발견되지 않은 보존 된 단백질 암호화 유전자가 더 이상 존재하지 않을 가능성도 배제했습니다.

“우리는 전체 게놈을 분석했으며 다른 보존 된 단백질 코딩 유전자가 없다고 확신합니다.”라고 연구의 주 저자이자 CSAIL 연구 과학자 인 Irwin Jungreis는 말합니다. “특성화되지 않은 유전자의 기능을 알아 내기 위해서는 실험적 연구가 필요하며, 어떤 유전자가 진짜인지를 결정함으로써 다른 연구자들이 단백질로 번역되지 않는 것에 시간을 소비하는 대신 그 유전자에 집중할 수 있도록합니다. .”

연구진은 또한 이전의 많은 논문에서 잘못된 유전자 세트를 사용했을뿐만 아니라 때로는 충돌하는 유전자 이름도 사용했다는 사실을 인식했습니다. 상황을 해결하기 위해 그들은 SARS-CoV-2 커뮤니티를 모아서 별도의 SARS-CoV-2 유전자 명명에 대한 일련의 권장 사항을 제시했습니다. 종이 몇 주 전에 게시 바이러스학.

빠른 진화

새로운 연구에서 연구원들은 SARS-CoV-1,800가 처음 확인 된 이후 발생한 2 개 이상의 돌연변이도 분석했습니다. 각 유전자에 대해 그들은 특정 유전자가 과거에 얼마나 빠르게 진화했는지와 현재의 유행병이 시작된 이후 얼마나 진화했는지를 비교했습니다.

그들은 대부분의 경우 현재 대유행 전염병이 발생하기 전에 오랜 기간 동안 빠르게 진화 한 유전자가 계속해서 그렇게 진화했으며 천천히 진화하는 경향이있는 유전자가 그 추세를 유지하고 있음을 발견했습니다. 그러나 연구원들은 또한 이러한 패턴에 대한 예외를 확인했으며, 이는 바이러스가 새로운 인간 숙주에 적응하면서 어떻게 진화했는지를 밝힐 수 있다고 Kellis는 말합니다.

한 예에서 연구진은 바이러스 유전 물질을 둘러싸고있는 뉴 클레오 캡시드 단백질의 한 영역을 확인했는데, 그 영역은 역사적 진화 패턴에서 예상했던 것보다 더 많은 돌연변이를 가졌습니다. 이 단백질 영역은 인간 B 세포의 표적으로도 분류됩니다. 따라서 그 지역의 돌연변이는 바이러스가 인간의 면역 체계를 회피하는 데 도움이 될 수 있다고 Kellis는 말합니다.

“SARS-CoV-2의 전체 게놈에서 가장 가속화 된 영역은이 뉴 클레오 캡시드 단백질의 중간에 자리 잡고 있습니다.”라고 그는 말합니다. "우리는 그 지역을 돌연변이시키지 않는 변이는 인간 면역 체계에 의해 인식되고 제거되는 반면, 그 지역에 무작위로 변이를 축적하는 변이는 실제로 인간 면역 체계를 더 잘 회피하고 순환 상태를 유지할 수 있다고 추측합니다."

연구진은 또한 영국의 B.1.1.7 균주, 브라질의 P.1 균주, 남아프리카의 B.1.351 균주와 같이 우려되는 변종에서 발생한 돌연변이를 분석했습니다. 이러한 변종을 더 위험하게 만드는 많은 돌연변이는 스파이크 단백질에서 발견되며 바이러스가 더 빨리 퍼지고 면역 체계를 피하는 데 도움이됩니다. 그러나 각 변종은 다른 돌연변이도 가지고 있습니다.

Jungreis는“각 변이에는 20 개 이상의 다른 변이가 있으며, 어떤 변이가 무언가를 할 가능성이있는 것과 그렇지 않은 것을 아는 것이 중요합니다. “그래서 우리는 비교 유전체학 증거를 사용하여 어느 것이 보존 된 위치에 있었는지에 따라 이들 중 어느 것이 중요 할 가능성이 있는지에 대한 첫 번째 통과 추측을 얻었습니다.”

이 데이터는 다른 과학자들이 바이러스의 감염성에 가장 큰 영향을 미칠 것으로 보이는 돌연변이에주의를 집중하는 데 도움이 될 수 있다고 연구원들은 말합니다. 그들은 주석이 달린 유전자 세트와 돌연변이 분류를 산타 크루즈 게놈 브라우저의 캘리포니아 대학에서 사용하려는 다른 연구자들을 위해 사용할 수 있도록했습니다.

“이제 우리는 이러한 변종의 진화 적 맥락을 실제로 연구하고 현재의 유행병이 더 큰 역사에 어떻게 부합하는지 이해할 수 있습니다.”라고 Kellis는 말합니다. "많은 돌연변이를 가진 균주의 경우, 우리는 이러한 돌연변이 중 어느 것이 숙주 특이 적 적응 일 가능성이 있는지, 어떤 돌연변이가 아마도 집에 쓸 것이 없는지 알 수 있습니다."

이 연구는 국립 인간 게놈 연구소와 국립 보건원에서 자금을 지원했습니다. Flatiron Institute for Computational Biology 센터의 연구 과학자 인 Rachel Sealfon도이 논문의 저자입니다.

코인 스마트. 유로파 최고의 비트 코인-보르 스
출처 : https://news.mit.edu/2021/map-sars-cov-2-genome-0511

spot_img

최신 인텔리전스

spot_img

우리와 함께 채팅

안녕하세요! 어떻게 도와 드릴까요?