ゼファーネットのロゴ

約束と落とし穴の要約 – パート 1 » CCC ブログ

日付:

CCC は、今年の AAAS 年次会議で 3 つの科学セッションをサポートしました。直接参加できなかった方のために、各セッションの概要を説明します。今週はセッションのハイライトをまとめます。科学における生成 AI: 約束と落とし穴」第 1 部では、レベッカ ウィレット博士による紹介とプレゼンテーションを要約します。

CCC の 2024 年年次総会の最初の AAAS パネルは、会議 16 日目の XNUMX 月 XNUMX 日金曜日に開催されました。 CCC自身が司会を務めるパネル マシュー・ターク博士シカゴ豊田工科大学の学長は、人工知能をさまざまな科学分野に応用する専門家で構成されています。 レベッカ・ウィレット博士シカゴ大学の統計学とコンピューターサイエンスの教授である彼女は、生成モデルが科学でどのように使用できるか、またなぜ既製のモデルが科学研究に適用するには十分ではないのかについてプレゼンテーションを中心に行いました。 マルクス・ビューラー博士マサチューセッツ工科大学の工学教授である彼は、材料科学に適用される生成モデルについて話しました。 ダンカン・ワトソン・パリス博士, カリフォルニア大学サンディエゴ校のスクリップス海洋研究所およびハリチュオール・データサイエンス研究所の助教授、気候科学の研究において生成モデルをどのように使用できるかについて議論しました。

コンピューター ビジョンと人間とコンピューターのインタラクションの専門家であるターク博士は、生成 AI をすべての AI から区別することからパネルディスカッションを開始しました。 「生成 AI アプリケーションの中核となるのは、膨大なトレーニング データの構造を学習し、学習した内容に基づいて新しいデータを生成するディープ ニューラル ネットワークで構成される生成モデルです。」

ターク博士はまた、生成システムに関する一般的な懸念についても概説しました。これは、存在しない法的準備書面を引用するシステム自体の障害と、悪意のある者による偽の音声や偽のコンテンツを生成するためにそのシステムが使用されることの両方によるものです。政治家や有名人の動画。

「特に」とターク博士は述べ、「このセッションは、科学の追求における変革力として、また破壊の潜在的なリスクとしての、科学における生成型 AI の使用に焦点を当てます。」と述べました。

レベッカ・ウィレット博士は、科学的発見プロセスをサポートするために生成 AI をどのように活用できるかを概説することでプレゼンテーションを始めました。彼女はまず、生成モデルがどのように機能するかに焦点を当てました。ウィレット博士のスライドからの以下の画像は、ChatGPT などの言語モデルが、以前の一連の単語が与えられた場合に単語の出現確率を評価する方法と、DALL-E 2 などの画像生成モデルが画像を生成する方法を示しています。トレーニング中に数十億の画像から学習した確率分布を使用して、特定のプロンプトから生成します。

「すべての生成モデルの基礎となるこの確率分布の原理を使用すると、これらのモデルは、現在の気候と潜在的な政策を考慮して起こり得る気候シナリオを生成したり、次のような標的機能を備えた新しいマイクロバイオームを生成したりするなど、科学におけるムーンショットのアイデアに適用できます。」プラスチックの分解に特に効果的です」とウィレット博士は言います。

ただし、ChatGPT や DALL-E 2 などの既製の生成ツールを科学研究に使用するだけでは十分ではありません。これらのツールは、科学者が活動する状況とは大きく異なる環境で作成されました。既製の生成モデルと科学モデルの明らかな違いの XNUMX つはデータです。科学では、仮説の基礎となるデータがほとんどないことがよくあります。科学データは通常、シミュレーションと実験から得られますが、どちらも費用と時間がかかることがよくあります。これらの制限があるため、科学者はどの実験を実行するか、またこれらのシステムの効率と有用性を最大化する方法を慎重に選択する必要があります。対照的に、既製のモデルは、操作できるデータ量を最大化することを優先し、データの出所をはるかに重視しません。科学においては、科学者は確固たる経験的証拠によって研究を正当化する必要があるため、データセットの精度とその起源は非常に重要です。

「さらに、科学においては、私たちの目標は、単にもっともらしいものを生み出すこととは異なります」とウィレット博士は言います。 「私たちは、これまで観察した範囲外で物事がどのように機能するかを理解する必要があります。」このアプローチは、データを可能性のある観測値の全範囲を表すものとして扱う生成 AI モデルとは相容れません。物理モデルと制約を生成 AI に組み込むと、物理現象をより適切に表現できるようになります。

科学モデルは、まれな事象を捉えることもできなければなりません。 「ChatGPT をトレーニングしているときは、多くのまれなイベントを無視しても問題ありませんが、対照的に、まれな気象現象を予測する気候モデルなど、科学の文脈では、まれなイベントが最も関心のあるものであることがよくあります。まれな事象を回避し、たとえばハリケーンをまったく予測しない生成モデルを使用する場合、このモデルは実際にはあまり役に立ちません。」

関連する課題は、初期条件に影響されやすいカオス プロセス用の生成 AI モデルの開発です。ウィレット博士は、ローレンツ 63 方程式に従って空間を移動する XNUMX つの粒子を示す以下のビデオを表示しました。これらの方程式は決定論的であり、ランダムではありませんが、XNUMX つのわずかに異なる開始位置が与えられると、いつでも XNUMX つの粒子が非常に異なる位置にある可能性があることがわかります。気候科学、乱気流、ネットワークダイナミクスで生じるこのようなプロセスの正確な経過を予測する生成 AI モデルを開発することは基本的に困難ですが、生成モデリングへの新しいアプローチにより、生成されたプロセスが実際の科学データと重要な統計的特性を共有することが保証されます。

[埋め込まれたコンテンツ]

最後に、ウィレット博士は、科学データは多くの場合、膨大な範囲の空間的および時間的スケールにまたがるという事実に言及しました。たとえば、材料科学では、研究者は材料をナノメートルスケールで研究し、飛行機全体などの大規模なシステムに至るまで研究します。 「そのスケール範囲は、既製のモデルで使用されるデータとは大きく異なります。スケール間の相互作用に正確に影響を与える方法で、これらの生成モデルを構築する方法を検討する必要があります。」

「生成モデルは科学の未来です」とウィレット博士は言います。「しかし、生成モデルを確実に効果的に使用するには、AI を根本的に進歩させ、データを ChatGPT に接続する以上のことを行う必要があります。」

読んでいただき誠にありがとうございます。明日は、メカノバイオロジーにおける生成 AI に関するマルクス ビューラー博士のプレゼンテーションの要約をお読みください。

スポット画像

最新のインテリジェンス

スポット画像