OpenAI の最近の出版物「Let's Verify Step by Step」(https://cdn.openai.com/improving-mathematical-reasoning-with-process-supervision/Lets_Verify_Step_by_Step.pdf) は、31 月 2023 日にリリースされたときすぐに私の注意を引きました。 XNUMX年。この論文の中心となる
内容は、人類が汎用人工知能 (AGI) の創造に近づいている可能性があるという示唆に富む仮説を示唆する 7 ページの図表です。
「プロセス監視 RM」曲線に特に注意してください。注意深く観察すると、右肩上がりが続いていることがわかります。最終的に頭打ちになるという予想に反して、この曲線は、計算能力を向上させることによって、
数学の問題が正しく解決される割合は今後も増加する可能性があります。十分なコンピューティング能力があれば、AI は前例のない規模で数学的課題を解決できる可能性があり、おそらく完璧に近い精度を達成することもできます。
その意味を深く掘り下げる前に、この分岐点に至るまでの道のりをたどり、その重要性を理解しましょう。
この開発のルーツは、「数学の文章問題を解決するための検証者のトレーニング」というタイトルの研究で 2021 年に発表されました。この研究では、数学の文章題データセットを使用して、175 億もの膨大なパラメーター モデルを含む大規模な AI 言語モデルを評価しました。
GSM8Kとして知られています。
カーニバルのスナックブースでは、ポップコーンを毎日販売して 50 ドルの収益を上げました。綿菓子の売り上げが5倍になりました。 30 日間のアクティビティの場合、ブースは家賃 75 ドルと材料費として 5 ドルを支払わなければなりません。料金を支払った後、ブースは XNUMX 日間でいくら稼いだでしょうか。
家賃や材料費は?
質問例
そのサイズにもかかわらず、これらのモデルは当初、限定的な成功しか示しておらず、問題の約 30% しか正しく解決できませんでした。
その有効性を高めるために、研究者らは革新的な手法をテストしました。つまり、一次モデルによって生成されたソリューションを評価するためだけに「検証」モデルを開発しました。テスト中に、この検証者は複数の候補ソリューションを分析し、
最も高いスコアを持つもの。この戦略によりパフォーマンスが大幅に向上し、AI が 30 倍大きい基本モデルとほぼ同等の結果を達成できるようになりました。
175 億のパラメーターは XNUMX 億のパラメーター モデルよりも優れているだけでなく、検証モデルはトランスフォーマー ベースの言語モデルよりも、より多くのデータに対してより適切にスケーリングできることがわかりました。
当初、検証者は、たとえその背後にある推論に欠陥があったとしても、正しい答えを特定することで報酬を得ることができました。このアプローチでは、誤った方法論から正確な結論が導き出されることがあり、これは大きな懸念事項でした。研究者は
この問題に対処するには、結果監視型報酬モデルをプロセス監視型報酬モデルに変更します。この変化は、検証者が最終結果だけではなく推論プロセスの正確さに焦点を当てることを意味しました。
前述したように、この素晴らしい結果は注目すべき論文「Let's Verify Step by Step」に記録されていますが、なぜ数学の満点が汎用人工知能につながるのかという疑問が生じます。
新しい知性理論
マウントキャッスルの研究に基づいた最新の知能理論は、脳の何千もの皮質柱が学習し、完全な物体のモデルを構築すると仮定しています。これらの列は、学習と処理の基本単位であると考えられています。
脳内では、それぞれが認識する世界のモデルを作成できます。ただし、脳の真の複雑さと知性は、これらの個々のモデルがどのように組み合わされ、統合されるかによって現れます。
おそらく、この統合により、環境についてのより微妙で包括的な理解が可能になります。個々の皮質柱は、物体や場面の部分的に異なる側面を処理しながら、連携して統一された認識を形成します。
さまざまな感覚入力と経験を組み合わせます。このプロセスにより、オブジェクトの認識だけでなく、コンテキスト、関係、抽象的な概念の理解も可能になります。
この理論は人工知能にも適用され、複数のモデルを統合することで、人間の知能に似た、より高度で一般化された形式の AI が実現する可能性があります。多数の、最終的には特化されたモデルを組み合わせるという脳の戦略を模倣することで、AI
システムは、世界についてのより全体的で微妙な理解を発展させる可能性があり、AGI の達成に向けた重要なステップとなります。
課題は、独立していながら相互接続された処理ユニットのこの複雑な相互作用を効果的に複製することにあります。脳が無数の皮質柱からの入力をシームレスに統合するのと同じように、AGI システムも多様なモデルを調和させる必要があります。
それぞれが独自の専門知識と視点を持ち、一貫した統合された知性を形成します。
個々の AI モデルが情報を学習して処理する方法にある程度の進歩が必要ですが、より重要なのは、それらのモデルをどのように統合するかです。特に正確な数学が必要となるのは、この統合プロセスです。
特殊な細胞、つまりグリッド細胞と場所細胞は連携して機能し、空間認識とナビゲーションのための複雑なネットワークを形成し、脳の測位システムを構築します。この測位システムは、現実上の仮想座標系と考えることができます。
ここでは、あらゆる動きや方向の変化が記録され、各皮質柱のモデルにエンコードされます。
数世紀を経て、『純粋理性批判』で紹介されたイマヌエル・カントの理論は有効であるように見えます。彼は、私たちが空間と時間について「アプリオリ」な知識を持っていると提案し、これらの概念を独立して生得的に理解していることを示唆しました。
経験の。
これらのモデルは、位置エンコーディングを使用し、ベクトル加算、三角関数、微積分を使用して単一の一貫したモデルを形成するために統合されます。このパスの統合は、統一された包括的なフォームに不可欠です
知性の。
正確な数学は人間の知性にとって重要な基盤であるようであり、私たちは画期的な進歩の瀬戸際にいるかもしれません。しかし、この爽快な進歩の中に落とし穴があります。それは既存の問題を劇的に悪化させ、ジレンマの影を落としています。
新しく見つけた道を越えて。
持続可能なインテリジェンス: AI の進歩にかかるコストを再考する
いくつかの考えられる答えを生成し、バリデーターに正しい答えを選択させるというアプローチでは、計算能力の需要が 1 回だけ発生するトレーニングから、システムが実行されるたびに発生する推論へと大幅に変化します。
使用されている。結局のところ、そのようなシステムが使用されるときは常に、数百または数千の可能な解決策を生成することが求められます。
言語モデルが最大 30 倍小さい場合でも、33 の可能な解決策を生成するよう求められた場合、推論には 1000 倍以上のエネルギーが使用されます (30/33.3 = XNUMX)。つまり、バリデータモデルのコストは考慮されていません。この計算量の急増
需要が増加すると、コンピューティングのコストとその環境への影響というすでに差し迫った懸念がさらに高まることは避けられません。
たとえば、唯一の 176 億パラメータのブルーム モデルは、倫理、透明性、同意を重視しているにもかかわらず、トレーニング中に 30 世帯に 25 年間電力を供給するのに相当するエネルギーを消費しました。 XNUMX トンの二酸化炭素を排出し、これは環境への影響となります。
車で地球を5周運転するのに相当します。
さらに、このような高度な AI モデルの実行にかかる経済的コストは膨大であり、限られた範囲のユースケースのみが経済的に実行可能になります。この経済的障壁により、資金豊富な少数の企業がこれらのテクノロジーを独占する可能性があります。
透明性とアクセシビリティが損なわれます。支配が少数の者の手に集中すると、これらの組織は広範な倫理的考慮事項よりも商業的利益を優先する可能性があるため、偏見などの既存の問題が悪化する可能性があります。私たちは直面するでしょう
偏見が永続し、潜在的に増幅されるテクノロジー環境のリスク。
高度な AI へのアクセスの独占性により、テクノロジーの世界に存在する不平等がさらに深まる可能性があり、小規模な企業や研究者はますます疎外されていることがわかります。
このようなディストピア的な未来は、重大な社会的問題につながります。「そのようなコストでAGIを入手できるのか?」というものです。
AI の適切性: 精度と効率のためのタスク調整
AI の将来の存続リスクに対処する取り組みは確かに重要ですが、AI テクノロジーがすでにもたらしている直接的な具体的な影響が影を落とす可能性があります。これらの影響は、開発に少しずつ近づくにつれて増幅される可能性があります。
汎用人工知能。
AGI への取り組みは、技術の進歩だけではなく、まさにこれらの影響を軽減するツールの作成でもあります。そのようなツールの 1 つである Diffusion Bias Explorer を使用すると、ユーザーは画像生成モデル、特に画像生成モデルに固有のバイアスを調査できます。
さまざまな職業の中で。
私たちが飢え、愚かで人間中心の社会に向けて取り組み続ける中で、AI を適切なものにすることで民主化に貢献し続けることが重要です。私たちは、タスク固有のツールの作成を簡素化するツールを開発することでこれを実現しています。
AI モデル。これらのツールは、事前トレーニングされた大規模な言語モデルを利用して、特定のタスクに合わせて調整された、より正確でエネルギー効率が高く、コスト効率の高い言語モデルを生成します。
https://cdn.openai.com/improving-mathematical-reasoning-with-process-supervision/Lets_Verify_Step_by_Step.pdf
- SEO を活用したコンテンツと PR 配信。 今日増幅されます。
- PlatoData.Network 垂直生成 Ai。 自分自身に力を与えましょう。 こちらからアクセスしてください。
- プラトアイストリーム。 Web3 インテリジェンス。 知識増幅。 こちらからアクセスしてください。
- プラトンESG。 カーボン、 クリーンテック、 エネルギー、 環境、 太陽、 廃棄物管理。 こちらからアクセスしてください。
- プラトンヘルス。 バイオテクノロジーと臨床試験のインテリジェンス。 こちらからアクセスしてください。
- 情報源: https://www.finextra.com/blogposting/25657/the-agi-horizon-how-one-chart-is-shaping-our-ai-expectations?utm_medium=rssfinextra&utm_source=finextrablogs