コンピューター科学者は、PlasmidHawkでバイオインフォマティクスの利点を示しています
クレジット:Tommy LaVergne / Rice University
ヒューストン–(26年2021月XNUMX日)–合成遺伝暗号の起源を追跡することは決して簡単ではありませんでしたが、バイオインフォマティクスまたはますます深層学習の計算アプローチを通じて行うことができます。
後者は大きな注目を集めていますが、ライス大学のブラウン工科大学のコンピューター科学者Todd Treangenによる新しい研究は、配列アラインメントとパンゲノムベースの方法がこの分野の最近の深層学習アプローチよりも優れているかどうかに焦点を当てています。
「ディープラーニングアプローチが最近BLASTなどの従来のアプローチを上回っていることを考えると、これはある意味で穀物に反します」と彼は言いました。 「この調査の私の目標は、両方のドメインの専門知識を組み合わせて、この重要な計算上の課題をさらに改善する方法についての会話を開始することです。」
バイオセキュリティおよび微生物法医学アプリケーションの計算ソリューションの開発を専門とするTreangenとRiceの彼のチームは、DNA配列を分析して目的の操作されたプラスミドのソースを特定するのに役立つバイオインフォマティクスアプローチであるPlasmidHawkを導入しました。
「シーケンスアラインメントベースのアプローチは、ラボオブオリジン予測の特定のタスクに対して畳み込みニューラルネットワーク(CNN)の深層学習法よりも優れていることを示しています」と彼は言いました。
Treangenと主執筆者であるRiceの大学院生であるQiWangが率いる研究者は、その結果をオープンアクセスの論文で報告しました。 ネイチャー·コミュニケーションズ.
オープンソースソフトウェアはここから入手できます:https:/
このプログラムは、潜在的に有害な操作されたシーケンスを追跡するだけでなく、知的財産を保護するためにも役立つ可能性があります。
「目標は、シーケンスの寄稿者の知的財産権を保護するのを助けるか、何か悪いことが起こった場合に合成シーケンスの起源を追跡するのを助けることです」とTreangenは言いました。
Treangenは、シーケンスの元のラボを追跡するためのリカレントニューラルネットワーク(RNN)ディープラーニング手法について説明している最近の注目を集めた論文に注目しました。 この方法では、単一のラボの予測で70%の精度が達成されました。 「以前のディープラーニングアプローチに対するこの重要な進歩にもかかわらず、PlasmidHawkは両方の方法よりもパフォーマンスが向上しています」と彼は言いました。
ライスプログラムは、ゲノムデータセットからの未知のコード文字列を直接整列させ、それらを合成生物学研究所に共通または固有の汎ゲノム領域に一致させます。
「起源の研究室を予測するために、PlasmidHawkは、分類されていない配列とプラスミドパンゲノムの間の一致する領域に基づいて各研究室をスコアリングし、次に未知の配列を最小スコアの研究室に割り当てます」とWang氏は述べています。
新しい研究では、深層学習実験の76つと同じデータセットを使用して、研究者は85%の確率で「未知のシーケンスの堆積ラボ」の予測が成功したと報告しました。 彼らは、10%の確率で正しいラボが上位XNUMX人の候補者に含まれていることを発見しました。
ディープラーニングアプローチとは異なり、PlasmidHawkはデータの前処理を減らす必要があり、既存のプロジェクトに新しいシーケンスを追加するときに再トレーニングする必要がないと彼らは言いました。 また、以前の深層学習アプローチとは対照的に、ラボの予測について詳細な説明を提供する点でも異なります。
「目標は、計算ツールボックスをできるだけ多くのツールで埋めることです」と、ライス大学のポスドク研究者である共著者のライアン・レオ・エルワースは述べています。 「最終的には、機械学習、より伝統的な計算技術、そしてあなたが取り組んでいる特定の生物学的問題の深い理解を組み合わせることで、最良の結果が得られると思います。」
###
ライス大学の大学院生であるBryceKilleとTianRuiLiuはこの論文の共著者です。 Treangenは、コンピュータサイエンスの助教授です。
この研究は、国立神経障害脳卒中研究所、国家情報長官室、および陸軍研究所を介して国立衛生研究所によってサポートされていました。 Addgeneは、寄託されたプラスミドのDNA配列へのアクセスを提供しました。
http:// dxで要約を読んでください。
このニュースリリースはhttps:/でオンラインで見つけることができます
ライスニュースとメディアリレーションをTwitter @RiceUNewsでフォローしてください。
関連資料
ミトコンドリアのストレス「年齢」の宇宙飛行士:http:// news。
ゲノムデータの洪水はバクテリアを特定する努力を妨げます:http:// news。
Treangenラボ:https:/
ライスコンピュータサイエンス学科:https:/
ジョージR.ブラウン工学部:https:/
ダウンロード用の画像:
https:/
キャプション:Todd Treangen (クレジット:Tommy LaVergne /ライス大学)
ヒューストンの300エーカーの森林に覆われたキャンパスに位置するライス大学は、US News&World Reportにより、一貫して全米トップ20の大学にランクされています。 ライスは、建築、ビジネス、継続研究、工学、人文科学、音楽、自然科学、社会科学の学校を高く評価しており、ベイカー公共政策研究所の本拠地です。 3,978人の学部生と3,192人の大学院生を抱えるライスの学部生と教員の比率は、6対1をわずかに下回っています。 その寄宿制大学システムは、緊密なコミュニティと生涯にわたる友情を築き上げています。これは、ライスが多くの人種/クラスの交流で1位、プリンストンレビューで生活の質で1位にランクされている理由のXNUMXつです。 ライスはまた、キプリンガーのパーソナルファイナンスによって私立大学の中で最高の価値として評価されています。
ジェフフォーク
713-348-6775
jfalk@rice.edu
マイクウィリアムス
713-348-6728
mikewilliams@rice.edu
メディア連絡先
マイクウィリアムス
mikewilliams@rice.edu
オリジナルソース
https:/
関連ジャーナル記事
http://dx.
出典:https://bioengineer.org/bioinformatics-tool-accurately-tracks-synthetic-dna/