ゼファーネットのロゴ

スパース ニューラル ネットワークは物理学者に有用なデータを指し示す | クアンタマガジン

日付:

概要

XNUMX ページある本がありますが、各ページには XNUMX 行のテキストしか含まれていないとします。 スキャナーを使用して本に含まれる情報を抽出することになっていますが、この特定のスキャナーだけが体系的にすべてのページをスキャンし、一度に XNUMX 平方インチずつスキャンします。 そのスキャナーで本全体を読み込むには長い時間がかかり、その時間のほとんどは空のスペースをスキャンするのに無駄になってしまいます。 

これが多くの実験物理学者の人生です。 素粒子実験では、有用な情報が含まれるのはほんの一部であっても、検出器は膨大な量のデータを取得して分析します。 「たとえば、空を飛んでいる鳥の写真では、すべてのピクセルが意味を持ちます」と説明しました。 寺尾和弘、SLAC国立加速器研究所の物理学者。 しかし、物理学者が観察する画像では、実際に重要なのはそのほんの一部だけであることがよくあります。 このような状況では、すべての詳細を注意深く検討すると、時間と計算リソースが不必要に消費されます。

しかし、それは変わり始めています。 スパース畳み込みニューラル ネットワーク (SCNN) として知られる機械学習ツールを使用すると、研究者はデータの関連部分に焦点を当て、残りを除外できます。 研究者はこれらのネットワークを使用して、リアルタイム データ分析を行う能力を大幅に加速してきました。 そして彼らは、少なくとも XNUMX つの大陸で今後行われる、または既存の実験に SCNN を採用することを計画しています。 この切り替えは、物理学コミュニティにとって歴史的な変化を示します。 

「物理学では、私たちは独自のアルゴリズムと計算アプローチを開発することに慣れています」と彼は言いました。 カルロス・アルグエレス・デルガド、ハーバード大学の物理学者。 「私たちは常に開発の最前線に立ってきましたが、現在では、計算の分野ではコンピューター サイエンスが先頭に立っていることが多いです。」 

スパース文字

SCNN につながる取り組みは 2012 年に始まりました。 ベンジャミングレアム当時ウォリック大学にいた彼は、中国語の手書き文字を認識できるニューラル ネットワークを作成したいと考えていました。 

このような画像関連タスクのための当時の主要なツールは畳み込みニューラル ネットワーク (CNN) でした。 中国語の手書きタスクの場合、作家はデジタル タブレット上で文字をトレースし、たとえば 10,000 ピクセルの画像を生成します。 次に CNN は、カーネルと呼ばれる 3 行 3 列のグリッドを画像全体に移動させ、カーネルを各ピクセルの中心に個別に配置します。 カーネルの配置ごとに、ネットワークは特徴的な特徴を探す畳み込みと呼ばれる複雑な数学的計算を実行します。

CNN は、写真などの情報量の多い画像で使用するように設計されています。 しかし、漢字を含む画像はほとんどが空です。 研究者は、この特性を持つデータをスパースと呼んでいます。 それは自然界のあらゆるものに共通する特徴です。 グラハム氏は、「世界がいかに希薄であるかを例として挙げると、エッフェル塔が可能な限り最小の長方形に収まるとすると、その長方形は「99.98%の空気とわずか0.02%の鉄」で構成されることになると述べた。

概要

Graham は、ゼロ以外の値を持つ (単なる空白ではない) ピクセルを少なくとも 3 つ含む画像の 3 行 2013 列のセクションにのみカーネルが配置されるように、CNN アプローチを微調整しようとしました。 こうして、手書きの中国語を効率的に識別できるシステムの構築に成功した。 2.61 年のコンテストでは、わずか 4.81% のエラー率で個々の文字を識別して優勝しました。 (人間のスコアは平均 XNUMX% でした。) 次に彼は、さらに大きな問題である XNUMX 次元オブジェクトの認識に注意を向けました。

2017 年までに、グラハムは Facebook AI Research に異動し、技術をさらに磨き、 公表   細部 最初の SCNN では、(少なくとも 3 つの「非ゼロ」ピクセルを持つ 3 行 XNUMX 列のセクションにカーネルを配置するのではなく) 非ゼロ値を持つピクセルのみをカーネルの中心に配置しました。 寺尾が素粒子物理学の世界に持ち込んだのは、この一般的なアイデアでした。

アンダーグラウンドショット

寺尾氏は、フェルミ国立加速器研究所で、最もとらえどころのない既知の素粒子の中でもニュートリノの性質を調べる実験に携わっています。 これらは(それほど多くはありませんが)質量を持つ宇宙で最も豊富な粒子でもありますが、検出器内に現れることはほとんどありません。 その結果、ニュートリノ実験のデータのほとんどはまばらであり、寺尾氏はデータ分析に対するより良いアプローチを常に模索していました。 彼は SCNN で XNUMX つを見つけました。

2019年、彼はSCNNを、2026年に稼働すると世界最大のニュートリノ物理学実験となる深層ニュートリノ実験(DUNE)から期待されるデータのシミュレーションにSCNNを適用した。このプロジェクトは、シカゴ郊外のフェルミ研究所からニュートリノを発射する予定である。 800マイルの地球を通ってサウスダコタ州の地下研究所まで。 その過程で、粒子は既知の XNUMX 種類のニュートリノの間で「振動」し、これらの振動によってニュートリノの詳細な特性が明らかになる可能性があります。

SCNN は、通常の方法よりも高速にシミュレートされたデータを分析し、その際に必要な計算能力が大幅に少なくなりました。 有望な結果は、SCNN が実際の実験実行中に使用される可能性が高いことを意味します。

一方、2021年に寺尾氏は、MicroBooNEとして知られるフェルミ研究所の別のニュートリノ実験にSCNNを追加するのを手伝った。 ここでは、科学者たちはニュートリノとアルゴン原子核との衝突の余波を調べています。 これらの相互作用によって作成された軌跡を調べることで、研究者は元のニュートリノについての詳細を推測することができます。 そのためには、検出器の XNUMX 次元表現内のピクセル (または、技術的にはボクセルと呼ばれる XNUMX 次元の対応物) を調べて、どのピクセルがどの粒子の軌道に関連付けられているかを判断できるアルゴリズムが必要です。

データが非常にまばらであるため、大きな検出器 (約 170 トンの液体アルゴン) 内に小さな線が点在するだけなので、SCNN はこのタスクにはほぼ完璧です。 標準的な CNN では、多くの計算を行うため、画像を 50 個の部分に分割する必要があると寺尾氏は述べています。 「スパース CNN を使用すると、画像全体を一度に分析でき、はるかに高速に分析できます。」

タイムリーなトリガー

MicroBooNE に取り組んだ研究者の XNUMX 人は、Felix Yu という名前の学部生インターンでした。 SCNN のパワーと効率に感銘を受けた彼は、南極にあるアイスキューブ ニュートリノ観測所と正式に提携しているハーバード大学の研究所の大学院生として、次の職場にそのツールを持ち込みました。

この天文台の重要な目標の 5,160 つは、宇宙で最もエネルギーの高いニュートリノを捕捉し、そのほとんどが銀河の外側にあるニュートリノの発生源まで追跡することです。 この検出器は、南極の氷に埋められた XNUMX 個の光センサーで構成されており、常時点灯するのはそのうちのほんの一部だけです。 配列の残りの部分は暗いままであり、特に有益ではありません。 さらに悪いことに、検出器が記録する「イベント」の多くは偽陽性であり、ニュートリノ探索には役に立ちません。 いわゆるトリガーレベルのイベントのみがさらなる分析の対象となり、どれがその指定に値し、どれが永久に無視されるかについて即座に決定する必要があります。

標準の CNN はこのタスクには遅すぎます。 そのため、IceCube の科学者は、潜在的に有用な検出について知らせるために、LineFit と呼ばれるアルゴリズムに長い間依存してきました。 しかし、そのアルゴリズムは信頼性が低く、「つまり、興味深い出来事を見逃してしまう可能性がある」とユウ氏は言う。 繰り返しになりますが、これは SCNN に最適な疎データ環境です。

ユウ氏は、彼の博士課程顧問のアルグエルス・デルガド氏とウィスコンシン大学マディソン校の大学院生ジェフ・ラザール氏とともに、その利点を数値化して次のように示した。 最近の論文 これらのネットワークは一般的な CNN よりも約 20 倍高速になると考えられます。 「これは、検出器から出てくるすべてのイベントを実行するには十分な速さです」と、毎秒約 3,000 件であると Lazar 氏は言いました。 「これにより、何を捨てて何を残すかについてより適切な決定を下せるようになります。」

概要

著者らは、公式の IceCube データを使用したシミュレーションで SCNN を採用することにも成功しており、次のステップは南極コンピューティング システムのレプリカでシステムをテストすることです。 すべてがうまくいけば、来年には南極天文台にシステムが設置されるはずだとアルグエルス・デルガド氏は考えている。 しかし、この技術はさらに幅広い用途に使用される可能性があります。 「我々は、(SCNNが)IceCubeだけでなく、すべてのニュートリノ望遠鏡に利益をもたらす可能性があると考えています」とアルグエルス・デルガド氏は語った。

ニュートリノを超えて

マサチューセッツ工科大学の物理学者フィリップ・ハリス氏は、SCNNがその中で最大の粒子衝突型加速器であるCERNの大型ハドロン衝突型加速器(LHC)を支援できることを期待している。 ハリス氏は、MIT の同僚であるコンピューター科学者のソン ハン氏からこの種のニューラル ネットワークについて聞きました。 「ソング氏はアルゴリズムを高速かつ効率的に作成する専門家です」とハリス氏は述べ、毎秒 40 万回の衝突が発生する LHC には最適です。

数年前に彼らが話をしたとき、ソング氏はハリス氏に、研究室のメンバーとともに進めている自動運転車のプロジェクトについて語った。 Song 氏のチームは、SCNN を使用して車両前方の空間(その大部分は空いている)の 3D レーザー マップを分析し、前方に障害物があるかどうかを確認していました。

ハリス氏と彼の同僚は、LHC でも同様の課題に直面しています。 2012 つの陽子がマシン内で衝突すると、その衝突により粒子で構成される膨張する球体が生成されます。 これらの粒子の XNUMX つがコレクタに衝突すると、二次粒子シャワーが発生します。 「このシャワーの全範囲を地図で示すことができれば、シャワーを発生させた粒子のエネルギーを決定できる」とハリス氏は述べ、これは物理学者が研究しているヒッグス粒子のような特別な対象となる可能性があると述べた。 XNUMX 年に発見された暗黒物質粒子、または物理学者が今も探している暗黒物質粒子。

「私たちが解決しようとしている問題は、点と点を結びつけることに帰着します」とハリス氏は言う。ちょうど自動運転車がレーザーマップの点を結んで障害物を検出するのと同じだ。

SCNN は LHC でのデータ分析を少なくとも 50 倍高速化するとハリス氏は述べた。 「私たちの最終的な目標は、[SCNN] を検出器に組み込むことです」。この作業には少なくとも XNUMX 年間の書類作成とコミュニティからの追加の賛同が必要です。 しかし、彼と彼の同僚は希望を抱いている。

総合すると、もともとコンピューターサイエンスの世界で考案されたアイデアである SCNN が、間もなくニュートリノ物理学 (DUNE)、ニュートリノ天文学 (IceCube)、高エネルギー物理学 (LHC) でこれまでに行われた最大の実験で役割を果たす可能性が高まっています。 。

グラハム氏は、完全にショックを受けたわけではないものの、SCNN が素粒子物理学に進出したことを知ってうれしい驚きを覚えたと語った。 「抽象的な意味では、空間を移動する粒子は、紙の上を移動するペンの先端に似ています。」と彼は言いました。

スポット画像

最新のインテリジェンス

スポット画像