ゼファーネットのロゴ

約束と落とし穴の要約 – パート 2 » CCC ブログ

日付:

CCC は、今年の AAAS 年次会議で 3 つの科学セッションをサポートしました。直接参加できなかった方のために、各セッションの概要を説明します。今週はセッションのハイライトをまとめます。科学における生成 AI: 約束と落とし穴」第 2 部では、メカノバイオロジーにおける生成 AI に関するマルクス ビューラー博士のプレゼンテーションを要約します。

Markus Buehler 博士は、材料科学の研究において生成モデルをどのように適用できるかについて説明することからプレゼンテーションを始めました。歴史的に材料科学では、研究者はデータを収集するか方程式を作成して材料の挙動を説明し、ペンと紙を使ってそれらを解決していました。コンピューターの出現により、研究者はこれらの方程式をより迅速に解き、たとえば統計力学を使用して非常に複雑なシステムを扱うことができるようになりました。ただし、問題によっては、従来のコンピューティング能力では十分ではありません。たとえば、以下の画像は、単一の小さなタンパク質の可能な配置の数を示しています (20 ^100  または 1.27×10^130 デザイン)。この可能な配置の量は、観測可能な宇宙の原子の数 (10^) よりも大きいです。80 アトム) が原因で、この問題は最大のスーパーコンピューターでも対処が難しくなります。 

生成モデルが登場する前は、科学者によって作成された方程式とアルゴリズムは、太古の昔からすべての研究者に共有されている特定の特性、つまり人類によって制限されていました。 「生成 AI を使用すると、人間の想像力を超えて、これまで私たちが十分に賢くなかったり、すべてのデータ ポイントにアクセスする能力がないためにできなかったことを発明したり発見したりできるようになります。同時に」とビューラー博士は言います。 「生成 AI を使用すると、新しい方程式やアルゴリズムを特定し、これらの方程式を解決できます。さらに、生成モデルは、これらの方程式をどのように開発して解決したかを説明することもできます。これは、研究者がモデルの「思考プロセス」を理解するために、高度な複雑さにおいて絶対に必要です。」これらのモデルがどのように機能するかについての重要な側面は、情報 (測定結果など) のグラフ表現を学習することで情報を知識に変換することです。  

出典: MJ ビューラー、 生成的知識の抽出、グラフベースの表現、およびマルチモーダル インテリジェント グラフ推論による科学的発見の加速、arXiv、2024

下の図は、新しい材料設計である階層的な菌糸体ベースの複合材料を示しています。これは生成 AI から構築され、菌糸体根茎、コラーゲン、ミネラルフィラー、表面機能化、多孔性と材料の複雑な相互作用のこれまでにない組み合わせを特徴としています。 

出典: MJ ビューラー、 Accelerated Scientific Discovery with Generative Knowledge Extraction、Graph-Based Representation、および Multimodal Intelligent Graph Reasoning、arXiv、2024 年。左: Mycrlium 複合材料。右: タンパク質の設計。 

さらに、生成 AI は、複雑なシステムを視覚化するのに役立ちます。 AI は、原子間の相互作用を記述する代わりに、これらの相互作用をグラフで表現し、材料がどのように機能し、動作し、さまざまなスケールで相互作用するかを機械的に説明します。これらのツールは強力ですが、単独ではこれらの高度に複雑な問題を解決するには十分ではありません。これを解決するには、物理​​シミュレーションを実行できるモデルと、力や応力、タンパク質の設計方法を予測できるモデルなど、多くのモデルを組み合わせることができます。これらのモデルが通信すると、個々のモデルが特定の目的を持つエージェントとなるエージェント モデルになります。各モデルの出力は他のモデルに伝達され、モデルの出力の全体的な評価で考慮されます。エージェントティック モデルは、既存のデータに対してシミュレーションを実行し、新しいデータを生成できます。そのため、データが限られているかゼロの領域の場合、研究者は物理モデルを使用してシミュレーションを実行するデータを生成できます。 「このタイプのモデリングは、生成モデルの将来の成長分野の 1 つです」とビューラー博士は言います。これらのタイプのモデルは、これまでスーパーコンピューターでは解決できないと考えられていた問題を解決でき、これらのモデルの一部は標準的なラップトップでも実行できます。

このような物理学にヒントを得た生成 AI モデルを設計する際の主な課題の 1 つは、研究者たちが依然として取り組んでいる問題であり、モデルをエレガントに構築する方法と、モデルを人間の脳や生物学的システムにより近づける方法です。生物学的システムには、皮膚を切ったときにその切り傷が時間の経過とともに治癒するなど、その動作を変える能力があります。モデルも同様に動作するように構築できます。常に切り傷を治癒するようにモデルをトレーニングする代わりに、モデルを再構成して動的に動作できるようにトレーニングすることができます。ある意味では、最初に尋ねられた質問と、どのように再構成できるかを考えるようにモデルをトレーニングします。特定のタスクを最適に解決するには、「自分自身」を使用します。これを使用して、定量的予測を行ったり (たとえば、タンパク質のエネルギー状況を予測するための非常に複雑なタスクを解決したり)、定性的予測を行って結果を推論したり、複雑なタスクに対する答えが開発されるにつれてさまざまな専門知識やスキルを統合したりすることができます。重要なのは、モデルは、どのようにして解決策に到達したか、特定のシステムがどのように機能するか、および人間の科学者にとって興味深い可能性があるその他の詳細も説明できることです。次に、材料設計アプリケーションなど、最も有望なアイデアとなるケースについて、実験を実行してこれらのシミュレーションの結果を予測および検証できます。

次にビューラー博士は、材料科学におけるこれらの生成モデルの具体的な応用について話しました。 「特定のタンパク質を与えて逆フォールディング問題を解決するためのエネルギーランドスケープを計算するには、そのタンパク質がどのようなものかを知る必要さえありません。必要なのは、このタンパク質を定義する構成要素と DNA 配列、およびその条件を知ることだけです。」特定のエネルギー環境を備えた特定の種類のタンパク質が必要な場合は、オンデマンドでそのタンパク質を設計することもできます。エージェント モデルには、さまざまなモデル、予測、データを組み合わせる機能があるため、これが可能になります。これを利用して、自然界には存在しない複雑な新規タンパク質を合成できます。私たちはプラスチックの代替品として超強力な繊維を持つタンパク質を発明したり、より優れた人工食品や新しい電池を作成したりできます。私たちは自然のツールボックスを使用して、自然が提供するものを超えて、進化の原則をはるかに超えて拡張することができます。たとえば、伸縮性が高い素材や特定の光学特性を備えた素材、あるいは外部からの手がかりに基づいて特性が変化する素材など、特定の目的に合わせて素材を設計できます。現在出現しているモデルは、これらの問題を解決できるだけでなく、これらの問題がどのように解決されるかを説明する機能も提供します。また、特定の戦略が機能し、他の戦略が機能しない理由を解明することもできます。彼らは、モデルに特定の材料がどのように動作するかを詳細に予測させるなど、新しい研究を予測することができ、研究室での調査研究や物理シミュレーションでこれを検証できます。これは驚くべきことであり、未来のように聞こえますが、実際に今日起こっていることです。」

スポット画像

最新のインテリジェンス

スポット画像