ゼファーネットのロゴ

シリコンバレーで汎用人型ロボットの夢が甦る

日付:

ロボットは何も新しいものではありません。 彼らは私たちの車を作り、床に掃除機をかけ、電子商取引の注文を準備し、さらにはサージの実行を手伝ってくれますIES。 しかし現在、汎用人型ロボットの SF ビジョンが少しずつ近づいているようです。

実体を持たない人工知能のパフォーマンスは近年急速に向上していますが、ほとんどのロボットは依然として比較的愚かです。 ほとんどの場合、それらは高度に専門化された目的に使用され、動作する環境は慎重に制御されており、特に自律性はありません。

それは、現実世界の厄介な不確実性の中で運用することは、現在の AI アプローチでは依然として困難だからです。 大規模な言語モデルの最近の偉業は印象的ですが、それらは、予測可能な方法で供給される、かなり限られたデータ型のパレットを扱っています。

現実の世界は複雑で多面的です。 汎用ロボットは、複数のデータ ソースからの入力を統合し、それらの入力が XNUMX 日のさまざまな時間帯やさまざまな種類の天候でどのように変化するかを理解し、人間からペット、車両に至るまであらゆるものの行動を予測し、これらすべてを同期する必要があります。移動と物体の操作という難しいタスクに挑戦します。

このような柔軟性はこれまで AI には備わっていませんでした。 ウェイモやクルーズなどの企業が、数十億ドルの投資にもかかわらず、運転というより制限された領域でも自動運転車の展開に依然として苦戦しているのはこのためだ。

しかし、企業の発表が信頼できるものであるとすれば、シリコンバレーの多くの人はそれが変わろうとしていると考えている。 ここ数カ月間、企業が自律型人型ロボットを宣伝する発表を相次ぎ、現在は人間しか実行できない広範なタスクをまもなく引き受けることができるようになった。

最新のものは Sanctuary の発表でした新しいフェニックスroの入口ボット 先週。 の 会社が持っている 既に示されている 人間が遠隔操作すると、同社のロボットは小売環境で商品の梱包、清掃、製品のラベル貼りなどの 100 以上のタスクを実行できるという。 しかし、新しいロボットは二足歩行で立ちます。 XNUMXフィートXNUMXインチ 背が高く、手は人間とほぼ同じくらい器用です。 It 最終的には完全に自律型になるように設計されています。

同社は段階的にそこに到達する計画を立てており、 による IEEEスペクトラム. 彼らのfi最初のステップは、あらゆる種類の活動を行う人間の動きを記録し、これを使用してより優れた遠隔操作ロボットを構築することです。 彼らはそうするだろう 徐々に 最も一般的なサブタスクの一部は自動化され始めますが、最も複雑なサブタスクは引き続き人間のオペレーターが処理します。 同社は時間の経過とともに、オペレーターが本質的に単なる監督と指示を行うだけになるまで、ますます多くのタスクを自動化したいと考えています。 最終的な目標は、オペレーターを完全に削除できるようにすることです。

人間の労働者がロボットの代替品を訓練することが一般的なアプローチのようです。 あ テスラが公開したビデオ 先週、Optimus の最新バージョンの多数の新機能を披露しました r改善されたオブジェクト操作、環境ナビゲーション、微細運動制御などのロボット。 ただし、モーション キャプチャ装置を装着してロボットにさまざまなタスクの完了方法を教えるエンジニアの映像も含まれていました。

テスラのロボットは、以前のものと比較すると、まだかなり遅く、不安定に見えました。 洗練されたデモ 我々ました 元祖人型ロボット会社であるボストン・ダイナミクスの製品を見ることに慣れてください。 しかし、これらは素晴らしいものとなったが、同社はその技術の商業用途を見つけるのに苦労してきた。 そしておそらく、業界や消費者に何が必要とされているかをよりしっかりと認識している企業は、より多くの幸運に恵まれるでしょう。それらを現実にします。

その流れで、アマゾンの極秘ロボットプロジェクトのニュースも最近報じられた。 同社は長年にわたり倉庫へのロボット導入に成功してきましたが、これは初めての試みです。 家庭用ロボット「アストロ」 やや失敗でした。 でも今、 による インサイダー, ch ジャイアントは、次世代ヘルパー ボットの機能を強化するために大規模言語モデル (LLM) を使用することを計画しているようです。

コードネーム バーナム氏によると、このデバイスは、最大規模の言語モデルに見られる新たな問題解決能力を利用して、会話の流暢さ、社会的認識、問題解決能力などを向上させると考えられています。

Astro はまだ車輪の付いたスクリーンにすぎないので、朝のコーヒーを取りに行くことはできません。 しかし、潜在的なアプリケーションのいくつかは インサイダー 参考例には、ストーブが燃え続けているのを見つけたら所有者に知らせる、紛失した車のキーを見つけるのを手伝う、子供たちが火を消しているかどうかを監視するなどが含まれます。 放課後に友達が来ました。

LLM がロボット工学をどのように推進できるかに注目しているのは彼らだけではないかもしれません。 最近、ChatGPT の作成者である OpenAI が数百万ドル規模のプロジェクトを主導したことが発表されました。 投資ラウンド ノルウェーの企業 1X は、NEO と呼ばれる二足歩行ロボットの発表を準備しています。 詳細はほとんど明らかにされていないが、AI のリーダーが自社のテクノロジーを現実世界と接続する方法を見つけることに熱心であることは想像に難くありません。

しかし、おそらくすべての汎用ロボット企業の中で最も興味深いのは Figure でしょう。 ステルス状態から出現 月である。 ボストン・ダイナミクス、テスラ、クルーズ、アップルの退役軍人で構成されたチームと少なくとも100億ドルの資金を擁​​する同社には野心がある of 物流から製造、小売まであらゆる分野で人間の労働力を置き換えます。 しかしこれまでのところ、同社は人型ロボット「Figure 01」についてあまり詳細を発表しておらず、画像も実際の写真ではなくグラフィックレンダリングのみである。

これは当然のことのように思えます。 大量に制作されたプロモーションビデオや光沢のあるコンピュータ生成画像は進歩を示す良い指標ではないため、これらの企業が現実世界の状況で具体的なデモを共有し始めるまではs, おそらく判断を留保するのが賢明でしょう。 それにもかかわらず、ロボットが間もなく私たちの間を歩くようになるかもしれないという新たな楽観的な感覚が生まれています。

画像のクレジット: サンクチュアリ AI

スポット画像

最新のインテリジェンス

スポット画像