ゼファーネットのロゴ

Google の Gemini AI がテクノロジーの次なる飛躍を示唆

日付:

GoogleがGeminiを発売、新しいです 人工知能システム 写真、テキスト、音声、音楽、コンピューターコードなど、ほぼあらゆる種類のプロンプトを理解し、知的に話すことができるように見えます。

このタイプの AIシステム として知られています マルチモーダルモデル。 これは、以前のアルゴリズムのようにテキストや画像を扱えるだけの一歩を超えたものです。 そしてそれは、AI が次にどこへ向かうのか、つまり外部からのリアルタイム情報を分析して対応できるようになるという強力なヒントを提供します。

Gemini の機能は、バイラルビデオで見られるほど高度ではないかもしれませんが、 慎重に精選されたテキストから編集されたもの 静止画プロンプトを見ると、AI システムが急速に進歩していることは明らかです。 彼らは、ますます複雑な入力と出力を処理できるようになろうとしています。

新しい機能を開発するために、AI システムはアクセスできる「トレーニング」データの種類に大きく依存します。 彼らは、写真の中の顔を認識したり、エッセイを書いたりするなどの推論を含む、自分の仕事を向上させるためにこのデータにさらされます。

現時点では、Google、OpenAI、Meta などの企業がモデルをトレーニングする際に使用するデータは依然として主に以下から収集されています。 インターネット上のデジタル化された情報。 しかし、抜本的に解決しようとする取り組みもある データの範囲を拡大する AIが取り組めるもの。 たとえば、常時オンのカメラ、マイク、その他のセンサーを使用することで、AI に何が起こっているかを認識させることが可能になります。 世界で起こっていることは起こっていること.

リアルタイムデータ

Googleの新しいGeminiシステムは、ライブビデオや人間の音声などのリアルタイムコンテンツを理解できることを示した。 新しいデータとセンサーを使用すると、AI は現実世界での出来事を観察し、議論し、それに基づいて行動できるようになります。

自動運転車、すでに 膨大な量のデータを収集する 彼らが私たちの道路を走行しているときは、この最も明白な例です。 この情報は最終的にメーカーのサーバーに保存され、そこで車両を運転している瞬間だけでなく、交通の流れの改善をサポートしたり、当局が不審者や犯罪者を特定したりするのに役立つ長期的な運転状況のコンピューターベースのモデルを構築するために使用されます。行動。

家庭では、私たちはすでにモーションセンサー、音声アシスタント、セキュリティカメラを使用して、活動を検出し、習慣を把握しています。 他の「スマート」家電も常に市場に登場しています。 この技術の初期の用途はよく知られていますが、次のようなものがあります。 エネルギー使用量を改善するために暖房を最適化する、習慣の理解がさらに進むでしょう。

これは、AI が家庭内での活動を推測できるだけでなく、将来何が起こるかを予測することもできることを意味します。 このデータは、たとえば医師によって使用される可能性があります。 病気の発症を早期に発見するために 糖尿病や認知症などの健康状態を把握し、ライフスタイルの変更を推奨し、フォローします。

現実世界に関する AI の知識がより包括的になると、AI はパートナーとして機能するようになります。 スーパーでは、計画している食事に最適で最も経済的な食材について話し合うことができます。 仕事では、AI が対面会議でクライアントの名前と興味を思い出させ、ビジネスを保護するための最適な方法を提案してくれるでしょう。 外国への旅行中、遭遇する可能性のある危険な状況に注意を払いながら、地元の観光名所についての継続的な会話を維持することができます。

プライバシーへの影響

このすべての新しいデータには非常に大きな前向きな機会がありますが、同等の機会もあります。 行き過ぎや侵入のリスク 人々のプライバシーについて。 これまで見てきたように、ユーザーはこれまで、ソーシャル メディアや検索エンジンなどの無料製品へのアクセスと引き換えに、驚くほど大量の個人情報を喜んで交換してきました。

AI が日常生活のあらゆる側面で私たちを認識し、サポートするようになるにつれて、将来のトレードオフはさらに大きくなり、潜在的により危険になるでしょう。

機会があれば、業界はオフラインのものも含め、生活のあらゆる側面にデータ収集を拡大し続けるでしょう。 政策立案者はこの新たな状況を理解し、利益とリスクのバランスを確保する必要があります。 新しい AI モデルの能力と普及だけでなく、収集されるコンテンツも監視する必要があります。

AI がその能力を次のフロンティア、つまり現実世界に拡張するとき、その可能性を制限できるのは私たちの想像力だけです。

この記事はから再公開されます 会話 クリエイティブコモンズライセンスの下で 読む 原著.

画像のクレジット: Google DeepMind / Unsplash

スポット画像

最新のインテリジェンス

スポット画像