ゼファーネットのロゴ

SARS-CoV-2ゲノムの包括的な地図

日付:

Covid-2020のパンデミックが始まってから数か月後の19年初頭、科学者たちはCovid-2感染の原因となるウイルスであるSARS-CoV-19の全ゲノムを配列決定することができました。 その遺伝子の多くはその時点ですでに知られていましたが、タンパク質をコードする遺伝子の完全な補完は未解決でした。

現在、広範な比較ゲノミクス研究を実施した後、MITの研究者は、SARS-CoV-2ゲノムの最も正確で完全な遺伝子注釈として説明するものを生成しました。 彼らの研究では、今日 ネイチャー·コミュニケーションズ、彼らはいくつかのタンパク質をコードする遺伝子を確認し、遺伝子として提案された他のいくつかはタンパク質をコードしないことを発見しました。

「この非常に重要なゲノムの真の機能的タンパク質コーディングコンテンツを発見するために、この強力な比較ゲノミクスアプローチを進化的シグネチャーに使用することができました」と、この研究の上級著者であり、MITのコンピューターサイエンスの教授であるマノリスケリスは述べています。コンピュータ科学人工知能研究所(CSAIL)、およびMITとハーバードのブロード研究所のメンバー。

研究チームはまた、ヒトへの感染を開始してからさまざまなSARS-CoV-2,000分離株で発生した約2の変異を分析し、免疫系を回避したり感染性を高めたりするウイルスの能力を変化させる上でこれらの変異がどれほど重要であるかを評価できるようにしました。 。

比較ゲノミクス

SARS-CoV-2ゲノムは、約30,000のRNA塩基で構成されています。 科学者たちは、関連するウイルスに見られるタンパク質コード遺伝子との類似性に基づいて、タンパク質コード遺伝子をコードすることが知られているいくつかの領域を特定しました。 他のいくつかの領域はタンパク質をコードしていると疑われましたが、それらはタンパク質をコードする遺伝子として明確に分類されていませんでした。

SARS-CoV-2ゲノムのどの部分に実際に遺伝子が含まれているかを特定するために、研究者らは比較ゲノミクスと呼ばれるタイプの研究を行い、類似のウイルスのゲノムを比較しました。 SARS-CoV-2ウイルスは、次のようなウイルスの亜属に属しています。 サルベコウイルス、そのほとんどはコウモリに感染します。 研究者らは、SARS-CoV-2、SARS-CoV(2003年のSARSの発生を引き起こした)、および42株のコウモリサルベコウイルスについて分析を行った。

Kellisは以前、このタイプの分析を行うための計算手法を開発しました。 ヒトゲノムを比較する 他の哺乳類のゲノムと。 この手法は、特定のDNAまたはRNA塩基が種間で保存されているかどうかを分析し、それらの進化のパターンを経時的に比較することに基づいています。

これらの技術を使用して、研究者らは、すべてのコロナウイルスで十分に確立されている2つに加えて、SARS-CoV-3ゲノムの3つのタンパク質コード遺伝子を確認しました。 彼らはまた、ORF3aと呼ばれる遺伝子をコードする領域がORF2cと名付けた追加の遺伝子もコードすることを決定しました。 この遺伝子には、ORFXNUMXaと重複するRNA塩基がありますが、異なるリーディングフレームで発生します。 この遺伝子内の遺伝子は、大きなゲノムではまれですが、多くのウイルスで一般的であり、そのゲノムはコンパクトな状態を維持するための選択圧下にあります。 この新しい遺伝子、および他のいくつかのSARS-CoV-XNUMX遺伝子の役割はまだわかっていません。

研究者らはまた、可能性のある遺伝子として提案された他のXNUMXつの領域が機能性タンパク質をコードしていないことを示し、さらに保存されたタンパク質コード遺伝子がまだ発見されていない可能性を排除しました。

「私たちはゲノム全体を分析し、他に保存されたタンパク質コード遺伝子がないことを確信しています」と、研究の筆頭著者でありCSAIL研究科学者であるIrwinJungreisは述べています。 「特徴のない遺伝子の機能を解明するには実験的研究が必要です。どの遺伝子が本物かを判断することで、他の研究者がタンパク質に翻訳されないものに時間を費やすのではなく、それらの遺伝子に注意を向けることができます。 。」

研究者たちはまた、以前の多くの論文が誤った遺伝子セットだけでなく、時には矛盾する遺伝子名も使用していることを認識しました。 この状況を改善するために、彼らはSARS-CoV-2コミュニティを結集し、SARS-CoV-2遺伝子に名前を付けるための一連の推奨事項を個別に提示しました。 数週間前に公開 ウイルス学.

速い進化

新しい研究では、研究者らは、SARS-CoV-1,800が最初に同定されてから発生した2を超える変異も分析しました。 彼らは、各遺伝子について、その特定の遺伝子が過去にどれだけ急速に進化したかと、現在のパンデミックが始まってからどれだけ進化したかを比較しました。

彼らは、ほとんどの場合、現在のパンデミックの前に長期間急速に進化した遺伝子がそうし続け、ゆっくりと進化する傾向のある遺伝子がその傾向を維持していることを発見しました。 しかし、研究者たちはこれらのパターンの例外も特定しました。これは、ウイルスが新しい人間の宿主に適応するにつれて、ウイルスがどのように進化したかを明らかにする可能性があるとケリス氏は言います。

一例では、研究者らは、ウイルスの遺伝物質を取り囲むヌクレオカプシドタンパク質の領域を特定しました。この領域には、その歴史的な進化パターンから予想されるよりもはるかに多くの変異がありました。 このタンパク質領域は、ヒトB細胞の標的としても分類されます。 したがって、その領域の突然変異は、ウイルスが人間の免疫系を回避するのを助けるかもしれない、とケリスは言います。

「SARS-CoV-2の全ゲノムで最も加速されている領域は、このヌクレオカプシドタンパク質の真ん中にあります」と彼は言います。 「その領域を変異させない変異体はヒトの免疫系に認識されて排除されるのに対し、その領域に変異をランダムに蓄積する変異体は実際にはヒトの免疫系を回避して循環を維持できると推測しています。」

研究者らはまた、英国のB.1.1.7株、ブラジルのP.1株、南アフリカのB.1.351株など、懸念される変異株で発生した突然変異を分析しました。 これらの変異体をより危険なものにする突然変異の多くはスパイクタンパク質に見られ、ウイルスがより速く広がり、免疫系を回避するのに役立ちます。 ただし、これらのバリアントはそれぞれ、他の変異も持っています。

「これらの変異体にはそれぞれ20を超える他の変異があり、どれが何かをしている可能性があり、どれがそうでないかを知ることが重要です」とJungreis氏は言います。 「そこで、比較ゲノミクスの証拠を使用して、保存された位置にあるものに基づいて、これらのうちどれが重要である可能性が高いかを最初に推測しました。」

このデータは、他の科学者がウイルスの感染力に重大な影響を与える可能性が最も高いと思われる突然変異に注意を向けるのに役立つ可能性があると研究者らは述べています。 彼らは、注釈付きの遺伝子セットとその突然変異分類を、カリフォルニア大学サンタクルーズ校のゲノムブラウザで、それを使用したい他の研究者が利用できるようにしました。

「これで、これらの亜種の進化の文脈を実際に調べて、現在のパンデミックがそのより大きな歴史にどのように適合するかを理解することができます」とケリスは言います。 「多くの突然変異を持っている株については、これらの突然変異のどれが宿主特異的な適応である可能性が高いか、そしてどの突然変異がおそらく何も書き留めていないかを見ることができます。」

この研究は、国立ヒトゲノム研究所と国立衛生研究所によって資金提供されました。 Flatiron Institute for ComputationalBiologyの研究科学者であるRachelSealfonもこの論文の著者です。

コインスマート。 BesteBitcoin-ヨーロッパのBörse
出典:https://news.mit.edu/2021/map-sars-cov-2-genome-0511

スポット画像

最新のインテリジェンス

スポット画像