ゼファーネットのロゴ

AI ツールが CRISPR 遺伝子編集用の約 200 の新しいシステムを明らかにした

日付:

CRISPR には問題があります。それは、富を恥じることです。

遺伝子編集システムが急速に名声を博して以来、科学者はより精度と精度の高い変異体を探してきました。

検索方法の 9 つは、細菌やその他の生物の DNA 内で CRISPR-CasXNUMX に関連する遺伝子をスクリーニングすることです。 別の企業は、研究室で CRISPR コンポーネントを人工的に進化させ、人体内での安定性、安全性、効率の向上など、より優れた治療特性を与えます。

このデータは、数十億の遺伝子配列を含むデータベースに保存されます。 これらのライブラリには珍しい CRISPR システムが隠されている可能性がありますが、検索するにはエントリが多すぎます。

今月、CRISPR の先駆者である Feng Zhang 博士が率いる MIT とハーバード大学のチームは、既存のビッグデータ アプローチからインスピレーションを得て、AI を使用して膨大な遺伝子配列を既知の CRISPR システムに類似する少数の配列に絞り込みました。

AI 彼らは、ビール醸造所、炭鉱、寒い南極の海岸、そして(冗談ではなく)犬の唾液で見つかる細菌など、珍しい細菌のゲノムを含むオープンソースのデータベースを精査しました。

わずか数週間で、このアルゴリズムは、188 の新しい CRISPR ベースのシステムを構成する可能性のある数千の新しい生物学的「部分」を特定しました。その中には、非常に珍しいものも含まれます。

何人かの新人候補が目立った。 たとえば、より少ない副作用で編集のために標的遺伝子をより正確にロックできるものもあります。 他のバリエーションは直接使用することはできませんが、一部の既存の CRISPR システムがどのように機能するかについての洞察を提供する可能性があります。たとえば、RNA をターゲットとするもの、DNA からタンパク質を構築するように細胞に指示する「メッセンジャー」分子です。

「生物多様性はまさに宝の山です」 張さん。 「この分析を行うことで、生物学の研究と潜在的に役立つものを発見できるという一石二鳥が可能になります。」と彼は言いました。 追加されました.

ワイルドハント

CRISPR はヒトにおける遺伝子編集能力で知られていますが、科学者たちはウイルス感染と戦う細菌においてこのシステムを初めて発見しました。

科学者たちは長い間、世界中の隅々から細菌のサンプルを収集してきました。 DNA 配列決定がますます手頃な価格で効率的になったおかげで、これらのサンプルの多くは、池のカスなど予期せぬソースからのものもあり、遺伝子の設計図が作成され、データベースに保管されています。

Zhang 氏は、新しい CRISPR システムの探索に精通しています。 「何年も前、私たちは『CRISPRの先には何があるのか​​、自然界には他のRNAプログラム可能なシステムはあるのか』という疑問を抱き始めました。」 言われ MIT News 今年の初め。

CRISPR は 20 つの構造で構成されています。 XNUMX つは、特定の遺伝子を標的とする「ブラッドハウンド」ガイド RNA 配列で、通常は約 XNUMX 塩基長です。 もうXNUMXつはハサミのようなCasタンパク質です。 細胞内に入ると、ブラッドハウンドは標的を見つけ、ハサミで遺伝子を切り取ります。 システムのより新しいバージョン (ベース編集や プライム編集、さまざまな種類の Cas タンパク質を使用して、一文字 DNA の交換を実行したり、RNA ターゲットを編集したりすることもできます。

戻る2021で, 張氏の研究室はCRISPR家系図の起源を追跡し、全く新しい家系を特定した。 オメガと呼ばれるこれらのシステムは、外来ガイド RNA とタンパク質はさみを使用しますが、ペトリ皿で培養されたヒト細胞の DNA を容易に切り取ることができます。

最近では、チームは 検索を拡大しました 生命の新たな分野である真核生物へ。 植物、動物、人間を含むこの家族のメンバーは、ナッツのような構造の中に DNA をしっかりと包み込んでいます。 対照的に、細菌にはこれらの構造がありません。 研究チームは、菌類、藻類、貝類(そう、生物多様性は奇妙で素晴らしいものです)をスクリーニングすることで、人間の DNA を編集するために再プログラムできるファンゾールと呼ばれるタンパク質を発見しました。これは、CRISPR のようなメカニズムが真核生物にも存在することの最初の証拠です。

しかし、目的は、ただ単に目的のために、輝かしい新しい遺伝子編集者を追い詰めることではありません。 むしろ、自然の遺伝子編集能力を利用して、それぞれに独自の長所を持つ遺伝子編集者のコレクションを構築し、遺伝性疾患を治療し、私たちの体の内部の仕組みを理解するのに役立ちます。

科学者たちはまとめると、XNUMX つの主要な CRISPR システムを発見しました。たとえば、さまざまな Cas 酵素と連携するシステムもあれば、DNA または RNA に特化するシステムもあります。

「自然は素晴らしいですね。 とても多様性があります」と張氏は言う。 。 「おそらく、RNA でプログラム可能なシステムはもっとたくさんあるでしょう。私たちは探索を続けており、できればさらに多くのことを発見したいと思っています。」

生物工学スクラブル

これが、チームが FLSHclust と呼ばれる新しい AI を構築した目的です。 彼らは、文書、音声、画像ファイルの大規模な蓄積の類似点を強調表示するソフトウェアなど、途方もないほど大規模なデータセットを分析するテクノロジーを、CRISPR に関連する遺伝子を探索するツールに変換しました。

完了すると、アルゴリズムはバクテリアの遺伝子配列を分析し、それらをグループに収集します。色を虹にクラスタリングするのと似ており、似た色をグループ化して、目的の色合いを見つけやすくします。 ここから、チームは CRISPR に関連する遺伝子に焦点を当てました。

このアルゴリズムは、細菌や古細菌の数十万のゲノムや数百万の謎の DNA 配列を含む複数のオープンソース データベースをくまなく調べました。 全体として、タンパク質をコードする遺伝子を数十億個スキャンし、それらを約 500 億個のクラスターにグループ化しました。 これらの中で、チームはまだ誰もCRISPRと関連付けておらず、数千の新しいCRISPRシステムを構成する可能性がある188個の遺伝子を特定した。

微生物から開発された XNUMX つのシステム 根性 動物と 黒海、CRISPR-Cas32で使用される通常の20塩基の代わりに9塩基のガイドRNAを使用しました。 検索クエリと同様、長ければ長いほど結果の精度が高くなります。 これらの長いガイド RNA の「クエリ」は、システムの副作用が少ない可能性があることを示唆しています。 もう XNUMX つのシステムは、以前の CRISPR ベースの診断システムと呼ばれるものに似ています。 シャーロック、感染性侵入者から単一の DNA または RNA 分子を迅速に感知できます。

培養ヒト細胞でテストしたところ、どちらのシステムも標的遺伝子の一本鎖を切り取って、小さな遺伝子配列をおよそ 13% の効率で挿入できました。 大したことのようには聞こえませんが、これは改善できるベースラインです。

研究チームはまた、これまで科学では知られていなかったRNAを標的とする新しいCRISPRシステムの遺伝子も発見した。 綿密な精査の後にのみ発見されるもので、このバージョンとまだ発見されていないバージョンは、世界中の細菌をサンプリングしても簡単に捕捉されず、したがって自然界では非常にまれであるようです。

「これらの微生物系の一部は、炭鉱からの水にのみ存在しました。」 研究著者のソウミャ・カンナン博士。 「もし誰かがそれに興味を持っていなかったら、私たちはそれらのシステムを見ることはなかったかもしれません。」

これらのシステムが人間の遺伝子編集に使用できるかどうかを知るのはまだ時期尚早です。 たとえば、DNA をランダムに切り刻むものは、治療目的には役に立たないでしょう。 しかし、AI は膨大な遺伝子データをマイニングして潜在的な「ユニコーン」遺伝子配列を見つけることができ、他の科学者がさらなる探索のために利用できるようになりました。

画像のクレジット: NIHの

スポット画像

最新のインテリジェンス

スポット画像