ゼファーネットのロゴ

AIとは何ですか? 人工知能について知っておくべきことはすべてここにあります

日付:

人工知能(AI)とは何ですか?

それはあなたが誰に尋ねるかによる。

1950年代に、フィールドの父は、 ミンスキー & マッカーシーは、人工知能を、以前は人間の知能を必要とすると考えられていたであろう機械によって実行されるタスクとして説明しました。

これは明らかにかなり広い定義です。そのため、何かが本当にAIであるかどうかについて議論が見られることがあります。

インテリジェンスを作成することの意味に関する最新の定義は、より具体的です。 GoogleのAI研究者であり、機械学習ソフトウェアライブラリKerasの作成者であるFrancois Cholletは、インテリジェンスは、新しい環境に適応して即興し、知識を一般化し、見慣れないシナリオに適用するシステムの能力に関連していると述べています。

「インテリジェンスとは、以前は準備していなかったタスクで新しいスキルを習得する効率です。」 彼は言った.

「知性はスキルそのものではありません。 それはあなたができることではありません。 それは、あなたが新しいことをどれだけうまくそしてどれほど効率的に学ぶことができるかということです。」

これは、仮想アシスタントなどの最新のAIを利用したシステムが、音声認識やコンピュータービジョンなどの限られた一連のタスクを実行するときにトレーニングを一般化する機能である「狭いAI」を実証したことを特徴とする定義です。

通常、AIシステムは、人間の知性に関連する次の行動の少なくとも一部を示します。計画、学習、推論、問題解決、知識表現、知覚、動き、操作、そして程度は少ないが社会的知性と創造性。

AIの種類は何ですか?

非常に高いレベルでは、人工知能はXNUMXつの大きなタイプに分けることができます。 

狭いAI

狭いAIは、今日のコンピューターで私たちの周りに見られるものです。明示的にプログラムされていない特定のタスクの実行方法を教えられた、または学習したインテリジェントシステムです。

このタイプのマシンインテリジェンスは、Apple iPhoneのSiri仮想アシスタントの音声と言語の認識、自動運転車の視覚認識システム、またはあなたが好きなものに基づいて好きな製品を提案するレコメンデーションエンジンで明らかです。過去に購入した。 人間とは異なり、これらのシステムは定義されたタスクの実行方法を学習または教えることしかできないため、ナローAIと呼ばれています。

一般的なAI

一般的なAIは非常に異なり、人間に見られる適応可能な知能のタイプであり、ヘアカットからスプレッドシートの作成、蓄積されたものに基づいたさまざまなトピックについての推論まで、さまざまなタスクを実行する方法を学習できる柔軟な形式の知能です。経験。 

これは、2001年のHALやターミネーターのスカイネットなどの映画でより一般的に見られる種類のAIですが、今日は存在しません。AIの専門家は、それがどれだけ早く実現するかについて激しく意見が分かれています。

ナローAIは何ができますか?

狭いAIには、膨大な数の新しいアプリケーションがあります。

  • 石油パイプラインなどのインフラストラクチャの目視検査を実行するドローンからのビデオフィードの解釈。
  • 個人カレンダーとビジネスカレンダーを整理します。
  • 簡単なカスタマーサービスの問い合わせに答える。
  • 他のインテリジェントシステムと調整して、適切な時間と場所でホテルを予約するなどのタスクを実行します。
  • 助け 潜在的な腫瘍を見つけるための放射線科医 X線で。
  • オンラインで不適切なコンテンツにフラグを付け、IoTデバイスによって収集されたデータからエレベータの摩耗を検出します。
  • 衛星画像から世界の3Dモデルを生成する…リストはどんどん増えています。

これらの学習システムの新しいアプリケーションは常に出現しています。 グラフィックカードデザイナー Nvidiaは最近、AIベースのシステムMaxineを発表しました、これにより、インターネット接続の速度にほとんど関係なく、高品質のビデオ通話を発信できます。 システムは、インターネット経由で完全なビデオストリームを送信せず、発信者の顔の表情や動きを再現するように設計された方法で発信者の少数の静止画像をアニメーション化する代わりに、このような通話に必要な帯域幅を10分のXNUMXに削減します。リアルタイムで、ビデオと見分けがつかないようにします。

ただし、これらのシステムが持つ未開拓の可能性と同じくらい、テクノロジーに対する野心が現実を超える場合があります。 その好例が自動運転車であり、それ自体がコンピュータービジョンなどのAIを利用したシステムによって支えられています。 電気自動車会社のテスラは、自動車のオートパイロットシステムがシステムのより限定された自動運転機能から「完全自動運転」にアップグレードされるというCEOのエロンムスクの当初のタイムラインよりも少し遅れています。完全自動運転オプションは最近になってようやく展開されました。ベータテストプログラムの一部としてのエキスパートドライバーの選択されたグループ。

一般的なAIは何ができますか?

AI研究者のVincentCMüllerと哲学者のNickBostromが2012/13年に50つの専門家グループ間で実施した調査では、XNUMX%の確率で 人工知能 (AGI)は2040年から2050年の間に開発され、90年までに2075%に上昇します。グループはさらに進んで、いわゆる「スーパーインテリジェンスボストロムが「事実上すべての関心領域で人間の認知能力を大幅に超える知性」と定義している「」は、AGIの達成から約30年後に期待されていました。 

ただし、AIの専門家による最近の評価はより慎重です。 Geoffrey Hinton、Demis Hassabis、YannLeCunなどの最新のAI研究分野のパイオニア 社会はAGIの開発にはほど遠いと言う。 現代のAIの分野における先導灯に対する懐疑論と、現代の狭いAIシステムのAGIとの非常に異なる性質を考えると、一般的な人工知能が近い将来社会を混乱させることを恐れる根拠はおそらくほとんどありません。

とは言うものの、一部のAI専門家は、人間の脳についての理解が限られていることを考えると、そのような予測は非常に楽観的であり、AGIはまだ何世紀も先にあると信じています。

AIの開発における最近のランドマークは何ですか?

ワトソン-1.jpg

IBM

現代の狭いAIは特定のタスクの実行に制限される場合がありますが、その専門分野の範囲内で、これらのシステムは超人的なパフォーマンスが可能な場合があり、場合によっては、本質的に人間として保持される特性である優れた創造性を示すことさえあります。

ブレークスルーが多すぎて決定的なリストをまとめることができませんでしたが、いくつかのハイライトは次のとおりです。 

  • 2009年、Googleは、自動運転のトヨタプリウスがそれぞれ10マイルの100回以上の旅を完了し、社会を無人車両への道に導くことができることを示しました。
  • 2011年、コンピュータシステム IBM Watsonは、米国のクイズ番組Jeopardyで優勝したときに、世界中で話題になりました。、ショーがこれまでに生み出した最高のプレーヤーのXNUMX人を打ち負かしました。 ショーに勝つために、ワトソンは、人間が提起した質問に答えるために処理されるデータの膨大なリポジトリで自然言語処理と分析を使用しました。
  • 2012年には、別の画期的な進歩により、以前はどのマシンにも複雑すぎると考えられていた多数の新しいタスクに取り組むAIの可能性が予告されました。 その年、AlexNetシステムはImageNet大規模視覚認識チャレンジで決定的に勝利しました。 AlexNetの精度は、画像認識コンテストのライバルシステムと比較してエラー率が半分になるほどで​​した。

AlexNetのパフォーマンスは、ニューラルネットワークに基づく学習システムの力を実証しました。これは、数十年前から存在していた機械学習のモデルですが、アーキテクチャの改良とムーアの法則によって可能になった並列処理能力の飛躍により、ようやくその可能性を実現しました。 コンピュータビジョンを実行する際の機械学習システムの腕前も、その年の見出しになりました。 インターネットのお気に入りを認識するためのシステムをトレーニングするGoogle:猫の写真.

世間の注目を集めた機械学習システムの有効性の次のデモンストレーションは Goの人間のグランドマスターに対するGoogleDeepMind AlphaGoAIの2016年の勝利、その複雑さが何十年もの間コンピュータを困惑させた古代中国のゲーム。 チェスの約200と比較して、囲碁は20ターンあたり約30の動きが可能です。 囲碁のゲームの過程で、最良のプレーを特定するために事前にそれぞれを検索している可能性のある動きは非常に多く、計算の観点からはコストがかかりすぎます。 代わりに、AlphaGoは、XNUMX万の囲碁ゲームで人間の専門家が演じる動きを取り、それらを深層学習ニューラルネットワークにフィードすることによってゲームをプレイする方法を訓練されました。

これらの深層学習ネットワークのトレーニングには非常に長い時間がかかる可能性があり、システムが最良の結果を達成するためにモデルを徐々に改良するため、大量のデータを取り込んで繰り返す必要があります。

しかしながら、 最近では、GoogleはAlphaGoZeroを使用してトレーニングプロセスを改善しました、それ自体に対して「完全にランダムな」ゲームをプレイし、それから学習したシステム。 GoogleDeepMindのCEOであるDemisHassabisは、チェスと将棋のゲームをマスターしたAlphaGoZeroの新しいバージョンも発表しました。

そしてAIは、新しいマイルストーンを超えてスプリントを続けています。 OpenAIによって訓練されたシステムが世界のトッププレーヤーを打ち負かしました オンラインマルチプレイヤーゲームDota2のXNUMX対XNUMXの試合で。

その同じ年、OpenAIは彼らを発明したAIエージェントを作成しました 自国語 協力して目標をより効果的に達成するために、続いてFacebookトレーニングエージェントが 交渉する & リー.

2020年は、AIシステムが、考えられるほぼすべてのトピックについて人間のように書き、話すことができるようになったように見える年でした。

問題のシステムは、Generative Pre-trained Transformer 3または略してGPT-3として知られ、オープンWebで利用可能な数十億の英語の記事でトレーニングされたニューラルネットワークです。

非営利団体OpenAIによってテストに利用できるようになった直後から、インターネットは、供給されたほぼすべてのトピックに関する記事を生成するGPT-3の機能で賑わっていました。人間が書いたものと区別してください。 同様に、印象的な結果が他の分野でも続き、その能力は 幅広いトピックに関する質問に説得力を持って答えます & 初心者のJavaScriptコーダーにも合格.

しかし、GPT-3で生成された記事の多くは真実らしさの空気を持っていましたが、さらにテストを行ったところ、生成された文はしばしば集会に合格しなかったことがわかりました。 表面的にはもっともらしいが混乱したステートメントを提供するだけでなく、時にはまったくナンセンスなこともあります.

将来のサービスの基礎に関して、モデルの自然言語理解を使用することに依然としてかなりの関心があります。 です OpenAIのベータAPIを介してソフトウェアに組み込む開発者を選択できます。 また、 MicrosoftのAzureクラウドプラットフォームを介して利用可能な将来のサービスに組み込まれる.

おそらく、AIの可能性の最も印象的な例は、Googleの注目に基づくニューラルネットワークAlphaFold 2020がノーベル化学賞に値すると言われる結果を示した2年後半に来ました。

アミノ酸として知られるタンパク質の構成要素を調べ、タンパク質の3D構造を導き出すシステムの能力は、病気が理解され、医薬品が開発される速度に大きな影響を与える可能性があります。 タンパク質構造予測の重要な評価コンテストで、AlphaFold 2は、タンパク質を説得力のあるモデリングを行うためのゴールドスタンダードである結晶学に匹敵する精度でタンパク質の3D構造を決定しました。

結果を返すのに数か月かかる結晶学とは異なり、AlphaFold2は数時間でタンパク質をモデル化できます。 タンパク質の3D構造が人間の生物学や病気で非常に重要な役割を果たしているため、このようなスピードアップは 医学の画期的な進歩として予告された、酵素がバイオテクノロジーで使用される他の分野での潜在的なアプリケーションは言うまでもありません。

機械学習とは何ですか?

これまでに述べた事実上すべての成果は、機械学習に由来します。機械学習は、近年のこの分野での成果の大部分を占めるAIのサブセットです。 今日人々がAIについて話すとき、彼らは一般的に機械学習について話します。 

現在、ある種の復活を楽しんでいます。簡単に言えば、機械学習とは、コンピューターシステムが、タスクの実行方法をプログラムするのではなく、タスクの実行方法を学習することです。 この機械学習の説明は、世界初の自己学習システムの1959つであるサミュエルチェッカープレイングプログラムを開発したこの分野のパイオニアであるアーサーサミュエルによって造られたXNUMX年にまでさかのぼります。

学習するために、これらのシステムには大量のデータが供給され、音声の理解や写真のキャプションなど、特定のタスクを実行する方法を学習するために使用されます。 このデータセットの品質とサイズは、指定されたタスクを正確に実行できるシステムを構築するために重要です。 たとえば、住宅価格を予測する機械学習システムを構築している場合、トレーニングデータには、物件のサイズだけでなく、寝室の数や庭のサイズなどの他の重要な要素も含める必要があります。

ニューラルネットワークとは何ですか?

機械学習の成功の鍵はニューラルネットワークです。 これらの数学モデルは、内部パラメーターを微調整して、出力内容を変更することができます。 ニューラルネットワークには、トレーニング中に特定のデータが提示されたときに何を吐き出す必要があるかを教えるデータセットが提供されます。 具体的には、ネットワークには、9から9までの数字のグレースケール画像が、各グレースケール画像に表示される数字を示す1989桁の文字列(XNUMXとXNUMX)とともに供給される場合があります。 次に、ネットワークがトレーニングされ、各画像に示されている数値が高精度で分類されるまで、内部パラメータが調整されます。 このトレーニングされたニューラルネットワークは、XNUMXからXNUMXまでの数値の他のグレースケール画像を分類するために使用できます。このようなネットワークは、XNUMX年にYann LeCunによって公開され、米国郵便局によって使用されたニューラルネットワークのアプリケーションを示す独創的な論文で使用されました。手書きの郵便番号を認識します。

ニューラルネットワークの構造と機能は、脳内のニューロン間の接続に非常に大まかに基づいています。 ニューラルネットワークは、相互にデータを供給するアルゴリズムの相互接続されたレイヤーで構成されています。 これらのレイヤー間を通過するデータに起因する重要性を変更することにより、特定のタスクを実行するようにトレーニングできます。 これらのニューラルネットワークのトレーニング中、データがレイヤー間を通過するときにデータに付加される重みは、ニューラルネットワークからの出力が目的の値に非常に近くなるまで変化し続けます。 その時点で、ネットワークは特定のタスクを実行する方法を「学習」します。 必要な出力は、画像内の果物に正しくラベルを付けることから、センサーデータに基づいてエレベータが故障する可能性がある時期を予測することまで、何でもかまいません。

機械学習のサブセットはディープラーニングであり、ニューラルネットワークは、大量のデータを使用してトレーニングされた多数のサイズの大きいレイヤーを備えた広大なネットワークに拡張されます。 これらのディープニューラルネットワークは、音声認識やコンピュータービジョンなどのタスクを実行するコンピューターの能力における現在の飛躍を後押ししています。

さまざまな長所と短所を持つニューラルネットワークにはさまざまな種類があります。 リカレントニューラルネットワーク(RNN)は、自然言語処理(NLP)(テキストの意味を理解する)と音声認識に特に適したニューラルネットの一種ですが、畳み込みニューラルネットワークは画像認識にルーツがあり、推奨と同じくらい多様な用途がありますシステムとNLP。 ニューラルネットワークの設計も進化しており、研究者もいます 長短期記憶と呼ばれるより効果的な形式のディープニューラルネットワークを改良する またはLSTM— NLPなどのタスクや株式市場の予測に使用されるRNNアーキテクチャの一種であり、Google翻訳などのオンデマンドシステムで使用するのに十分な速度で動作できるようにします。 

ai-ml-ニューラルネットワーク.jpg

ディープニューラルネットワークの構造とトレーニング。

画像:ニュアンス

他の種類のAIは何ですか?

AI研究のもうXNUMXつの分野は 進化的計算。

それはダーウィンの自然淘汰の理論から借りています。 遺伝的アルゴリズムは、特定の問題に対する最適なソリューションを進化させるために、世代間でランダムな突然変異と組み合わせを行うことがわかります。

このアプローチは、AIモデルの設計を支援するためにも使用されており、AIを効果的に使用してAIの構築を支援しています。 ニューラルネットワークを最適化するための進化的アルゴリズムのこの使用は、ニューロエボリューションと呼ばれます。 特にデータサイエンティストの需要が供給を上回ることが多いため、インテリジェントシステムの使用が普及するにつれて、効率的なAIの設計を支援する上で重要な役割を果たす可能性があります。 テクニックはによって紹介されました 論文を発表したUberAI Labs 強化学習問題のために深層ニューラルネットワークを訓練するために遺伝的アルゴリズムを使用することについて。

最後に、あります エキスパートシステム、コンピュータは、多数の入力に基づいて一連の決定を下すことができるルールでプログラムされており、そのマシンが特定のドメインの人間の専門家の行動を模倣できるようにします。 これらの知識ベースシステムの例は、例えば、飛行機を飛ばす自動操縦システムであるかもしれません。

AIの復活を後押ししているのは何ですか?

上で概説したように、近年のAI研究の最大の進歩は、機械学習の分野、特に深層学習の分野にあります。

これは、データの容易な入手可能性によって部分的に推進されてきましたが、並列計算能力の爆発的な増加によってさらに促進されました。その間、機械学習システムをトレーニングするためのグラフィックスプロセッシングユニット(GPU)のクラスターの使用がより一般的になりました。 

これらのクラスターは、機械学習モデルをトレーニングするためのはるかに強力なシステムを提供するだけでなく、インターネットを介してクラウドサービスとして広く利用できるようになりました。 時間の経過とともに、主要なテクノロジー企業、 でログイン, Microsoft、およびTeslaは、実行中のモデルと最近ではトレーニング用の機械学習モデルの両方に合わせた特殊なチップの使用に移行しました。

これらのカスタムチップのXNUMXつの例は、GoogleのTensor Processing Unit(TPU)です。この最新バージョンは、GoogleのTensorFlowソフトウェアライブラリを使用して構築された有用な機械学習モデルがデータから情報を推測できる速度と、彼らは訓練することができます。

これらのチップは、DeepMindとGoogle Brainのモデル、およびGoogle翻訳とGoogleフォトの画像認識をサポートするモデル、および一般の人々がを使用して機械学習モデルを構築できるようにするサービスをトレーニングするために使用されます。 GoogleのTensorFlowResearch Cloud。 これらのチップの第2018世代は、100年XNUMX月のGoogleのI / O会議で発表されて以来、ポッドと呼ばれる機械学習の大国にパッケージ化されており、XNUMX秒あたりXNUMX万兆回以上の浮動小数点演算(XNUMXペタフロップス)を実行できます。 これらの継続的なTPUアップグレードにより、Googleは、たとえば、機械学習モデルの上に構築されたサービスを改善することができました。 Google翻訳で使用されるモデルのトレーニングにかかる​​時間を半分にします.

機械学習の要素は何ですか?

前述のように、機械学習はAIのサブセットであり、通常、教師あり学習と教師なし学習のXNUMXつの主要なカテゴリに分けられます。

教師あり学習

AIシステムを教えるための一般的な手法は、多くのラベル付きの例を使用してAIシステムをトレーニングすることです。 これらの機械学習システムには大量のデータが供給され、関心のある機能を強調するために注釈が付けられています。 これらは、犬が含まれているかどうかを示すラベルが付いた写真や、「低音」という単語が音楽または魚に関連しているかどうかを示す脚注のある文章である可能性があります。 トレーニングが完了すると、システムはこれらのラベルを新しいデータ、たとえばアップロードされたばかりの写真の犬に適用できます。

例によって機械を教えるこのプロセスは、教師あり学習と呼ばれます。 これらの例のラベル付けは、通常、 Amazon MechanicalTurkなどのプラットフォームで雇用されているオンラインワーカー.

これらのシステムのトレーニングには通常、膨大な量のデータが必要です。一部のシステムでは、タスクを効果的に実行する方法を学習するために数百万の例を精査する必要がありますが、これはビッグデータと広範なデータマイニングの時代にますます可能になっています。 トレーニングデータセットは巨大でサイズが大きくなっています— GoogleのOpenImagesDatasetには約XNUMX万枚の画像があります、ラベル付きのビデオリポジトリ YouTube-8M XNUMX万本のラベル付き動画へのリンク。 ImageNetこの種の初期のデータベースの14つである、には、50万を超える分類された画像があります。 000年間で編集され、約XNUMX万人がまとめました。そのほとんどは、Amazon Mechanical Turkを通じて採用され、約XNUMX億枚の候補写真をチェック、並べ替え、ラベル付けしました。 

ラベル付けされた巨大なデータセットにアクセスできることは、長期的には大量のコンピューティングパワーにアクセスすることほど重要ではないこともわかります。

近年、Generative Adversarial Networks(GAN)は、大量のラベルなしデータと一緒に少量のラベル付きデータのみを必要とする機械学習システムで使用されています。これは、名前が示すように、準備に必要な手作業が少なくて済みます。

このアプローチにより、半教師あり学習の使用を増やすことができます。この場合、システムは、今日の教師あり学習を使用するトレーニングシステムに必要な量よりもはるかに少ない量のラベル付きデータを使用して、タスクの実行方法を学習できます。

教師なし学習

対照的に、教師なし学習は別のアプローチを使用します。このアプローチでは、アルゴリズムがデータのパターンを識別し、そのデータを分類するために使用できる類似点を探します。

例としては、同じ量の果物や同じようなエンジンサイズの車をクラスター化する場合があります。

アルゴリズムは、特定のタイプのデータを選択するために事前に設定されていません。 それは単に、その類似性がグループ化できるデータを探すだけです。たとえば、Googleニュースは、毎日同様のトピックに関する記事をグループ化します。

強化学習

強化学習の大まかな例えは、ペットがトリックを実行したときにおやつを与えることです。 強化学習では、システムは入力データに基づいて報酬を最大化しようとします。基本的には、可能な限り最良の結果に到達するまで試行錯誤のプロセスを経ます。

強化学習の例は、GoogleDeepMindのDeepQ-networkです。 さまざまな古典的なビデオゲームで最高の人間のパフォーマンスに使用されています。 システムには各ゲームからピクセルが供給され、画面上のオブジェクト間の距離など、さまざまな情報が決定されます。

各ゲームで達成されたスコアも確認することで、システムは、さまざまな状況でスコアを最大化するアクションのモデルを構築します。たとえば、ビデオゲームのブレイクアウトの場合、インターセプトするためにパドルを移動する必要があります。ボール。

アプローチ ロボット工学の研究にも使用されています、強化学習は、自律型ロボットに実世界の環境で動作する最適な方法を教えるのに役立ちます。

ai-ml-gartner-hype-cycle.jpg

多くのAI関連テクノロジーは、バックラッシュ主導の「幻滅の谷」が待ち構えている状態で、ガートナーのハイプサイクルの「膨らんだ期待のピーク」に近づいているか、すでに到達しています。

画像:Gartner /注釈:ZDNet

AIの大手企業はどれですか?

AIが最新のソフトウェアとサービスでますます主要な役割を果たしているため、各主要なテクノロジー企業は、社内で使用するための堅牢な機械学習テクノロジーを開発し、クラウドサービスを介して一般に販売するために戦っています。

それぞれがAI研究の新境地を開拓するための見出しを定期的に作成していますが、おそらくAIの一般の認識に最大の影響を与えたのはDeepMind AIAlphaFoldおよびAlphaGoシステムを備えたGoogleでしょう。

どのAIサービスが利用できますか?

すべての主要なクラウドプラットフォーム(Amazon Web Services、Microsoft Azure、Google Cloud Platform)は、機械学習モデルをトレーニングおよび実行するためのGPUアレイへのアクセスを提供します。 Googleはまた、ユーザーがテンソルプロセッシングユニットを使用できるように準備を進めています —機械学習モデルのトレーニングと実行用に設計が最適化されたカスタムチップ。

必要な関連インフラストラクチャとサービスはすべて、機械学習モデルのトレーニングに必要な膨大な量のデータを保持できるクラウドベースのデータストア、分析用にデータを変換するサービス、視覚化ツールのXNUMXつから利用できます。結果を明確に表示し、モデルの構築を簡素化するソフトウェア。

これらのクラウドプラットフォームは、Googleが提供することで、カスタムの機械学習モデルの作成をさらに簡素化します。 CloudAutoMLと呼ばれるAIモデルの作成を自動化するサービス。 このドラッグアンドドロップサービスは、カスタムの画像認識モデルを構築し、ユーザーが機械学習の専門知識を持っていないことを要求します。

クラウドベースの機械学習サービスは常に進化しています。 アマゾンは現在、AWSオファリングのホストを提供しています 機械学習モデルのトレーニングプロセスを合理化するように設計されています & 最近発売されたAmazonSageMaker Clarify、組織がトレーニングデータの偏りや不均衡を根絶するのに役立つツールであり、トレーニングされたモデルによる予測の偏りにつながる可能性があります。

独自の機械学習モデルを構築するのではなく、音声、ビジョン、言語認識などのAIを利用したオンデマンドサービスを利用したい企業にとって、MicrosoftAzureは幅広いサービスで際立っています。オファー、続いてGoogle Cloud Platform、AWSの順です。 一方、IBMは、より一般的なオンデマンドサービスとともに、ヘルスケアから小売まですべてを対象としたセクター固有のAIサービスの販売も試みており、これらのサービスをグループ化しています。 IBM Watson傘下、The WeatherChannelの購入に2億ドルを投資した AIサービスを強化するためにデータの山のロックを解除します。

AIレースで優勝している主要なテクノロジー企業はどれですか?

アマゾンエコープラス2.jpg

画像:Jason Cipriani / ZDNet

内部的には、各ハイテク巨人やFacebookなどの他の企業は、AIを使用して、検索結果の提供、推奨事項の提供、写真内の人物や物の認識、オンデマンド翻訳、スパムの発見など、無数の公共サービスを推進しています。リストは膨大です。

しかし、このAI戦争の最も目に見える兆候のXNUMXつは、AppleのSiri、AmazonのAlexa、Googleアシスタント、MicrosoftCortanaなどの仮想アシスタントの台頭です。

音声認識と自然言語処理に大きく依存しており、クエリに答えるために膨大なコーパスを利用する必要があるため、これらのアシスタントの開発には膨大な量の技術が費やされています。

しかし、AppleのSiriが最初に目立つようになったかもしれませんが、AI分野でアシスタントがAppleを追い抜いたのはGoogleとAmazonです。Googleアシスタントは幅広いクエリに答えることができ、AmazonのAlexaは膨大な数の「スキル」を備えています。サードパーティの開発者がその機能を追加するために作成したもの。

時間が経つにつれて、これらのアシスタントは、人々が定期的な会話で尋ねるタイプの質問をより応答性が高く、より適切に処理できるようにする能力を獲得しています。 たとえば、Googleアシスタントでは、継続的な会話と呼ばれる機能が提供されるようになりました。この機能では、ユーザーは最初のクエリに対して、「今日の天気はどうですか?」、「明日はどうですか?」などのフォローアップ質問をすることができます。 システムは、フォローアップの質問が天気にも関連していることを理解しています。

これらのアシスタントと関連サービスは、音声だけでなく、テキストを画像に変換し、写真を使用して衣服や家具を検索できるGoogleレンズの最新版を使用して処理することもできます。

Windows 10に組み込まれているにもかかわらず、Cortanaは最近特に厳しい時期にあり、AmazonのAlexaがWindows 10PCで無料で利用できるようになりました。 同時に、マイクロソフト オペレーティングシステムにおけるCortanaの役割を刷新 音楽の再生など、他のアシスタントに見られる消費者向けの機能ではなく、ユーザーのスケジュールの管理などの生産性タスクに重点を置くこと。  

AIで先導している国はどこですか?

米国のハイテク巨人がAIの分野を縫い合わせていると考えるのは大きな間違いでしょう。 中国企業のAlibaba、Baidu、Lenovoは、eコマースから自動運転に至るまでの分野でAIに多額の投資を行っています。 中国は国として、AIを国の中核産業に変えるためのXNUMX段階の計画を追求しています。 150年末までに22億元(2020億ドル)の価値があるもの になる 2030年までに世界をリードするAIパワー.

Baiduは自動運転車の開発に投資しています、ディープラーニングアルゴリズムであるBaiduAutoBrainを搭載しています。 数年のテストの後、Apollo自動運転車は テストで100万マイル以上の運転を積み上げ、世界000都市で27万人以上の乗客を運びました.

Baiduは、今年北京で40台のApollo GoRobotaxisを発売しました。 同社の創設者は、自動運転車がXNUMX年以内に中国の都市で一般的になると予測しています。 

弱いプライバシー法、巨額の投資、協調的なデータ収集、Baidu、Alibaba、Tencentなどの大手企業によるビッグデータ分析の組み合わせは、将来のAI研究に関して、中国が米国よりも有利であると一部のアナリストが信じていることを意味します、XNUMX人のアナリストが 中国が米国を500対1でリードし、中国に有利に.

Baidu-autonomous-car.jpg

Baiduの自動運転車、改造されたBMW3シリーズ。

画像:Baidu

AIを使い始めるにはどうすればよいですか?

PC用に適度に強力なNvidiaGPU(Nvidia GeForce RTX 2060以降のどこか)を購入して機械学習モデルのトレーニングを開始することもできますが、AI関連サービスを試す最も簡単な方法はおそらくクラウド経由です。

主要なテクノロジー企業はすべて、独自の機械学習モデルを構築およびトレーニングするインフラストラクチャから、音声、言語、ビジョン、感情認識などのAIを活用したツールにオンデマンドでアクセスできるウェブサービスまで、さまざまなAIサービスを提供しています。 。

AIは世界をどのように変えるのでしょうか?

ロボットと自動運転車

ロボットが自律的に行​​動し、周囲の世界を理解してナビゲートできるようにしたいという願望は、ロボット工学とAIの間に自然な重複があることを意味します。 AIはロボット工学で使用されるテクノロジーのXNUMXつにすぎませんが、AIはロボットが次のような新しい分野に移動するのを支援しています 自己駆動車配達ロボット ロボットを助けます 新しいスキルを学ぶ。 2020年の初めに、 ゼネラルモーターズとホンダがクルーズの起源を明らかに、電動の無人運転車と、Googleの親会社であるAlphabet内の自動運転グループであるWaymoは、最近、アリゾナ州フェニックスでrobotaxiサービスを一般に公開しました。 市内の50平方マイルのエリアをカバーするサービスを提供する.

偽のニュース

私たちはできる神経ネットワークを持つ寸前です 写実的な画像を作成する or ピッチパーフェクトな方法で誰かの声を複製する。 これに伴い、ビデオやオーディオの映像を本物として信頼できなくなるなど、非常に破壊的な社会変化の可能性があります。 有名人の顔を説得力のあるアダルト映画につなぎ合わせるためのツールがすでに作成されているため、このようなテクノロジーを使用して人々の画像を悪用する方法についても懸念が高まっています。

音声と言語の認識

機械学習システムは、コンピューターが人々の発言をほぼ95%の精度で認識するのに役立ちました。 マイクロソフトの人工知能と研究グループはまた、それが転写するシステムを開発したと報告しました 人間の筆記者と同じくらい正確に英語を話しました.

研究者が99%の精度という目標を追求する中で、コンピューターとの会話が、より伝統的な形式の人間と機械の相互作用とともにますます一般的になることを期待してください。

一方、OpenAIの言語予測モデルGPT-3は最近、人間が書いたものとして通過する可能性のある記事を作成する能力で話題を呼んだ。

顔認識と監視

近年、顔認識システムの精度は飛躍的に進歩し、 中国のハイテク大手Baiduは、99%の精度で顔を一致させることができると述べています、顔を提供することはビデオで十分に明確です。 西側諸国の警察は一般に大規模なイベントで顔認識システムの使用を試みただけですが、中国では、当局は全国のCCTVを顔認識に接続し、AIシステムを使用して容疑者や疑わしい行動を追跡する全国的なプログラムを開始しています。と持っています また、警察による顔認識メガネの使用を拡大しました.

プライバシー規制は世界的に異なりますが、感情を認識できるAIを含むAIテクノロジーのこのより侵入的な使用は、徐々に普及する可能性があります。 しかし、顔認識システムの公平性に関する反発と疑問の高まりにより、Amazon、IBM、およびMicrosoftは、これらのシステムの法執行機関への販売を一時停止または停止しました。

ヘルスケア

AIは最終的に医療に劇的な影響を及ぼし、放射線科医がX線で腫瘍を発見するのを助け、研究者が病気に関連する遺伝子配列を見つけ、より効果的な薬につながる可能性のある分子を特定するのを助けます。 GoogleのAlphaFold2機械学習システムによる最近の進歩により、新薬を開発する際の重要なステップにかかる時間が数か月から数時間に短縮されることが期待されています。

世界中の病院でAI関連技術の試験が行われています。 これらには、腫瘍学者がメモリアルスローンケタリングがんセンターでトレーニングするIBMのワトソン臨床意思決定支援ツールが含まれます。 英国の国民保健サービスによるGoogleDeepMindシステムの使用、眼の異常を発見し、頭頸部がんの患者をスクリーニングするプロセスを合理化するのに役立ちます。

差別と偏見を強化する 

懸念が高まっているのは、機械学習システムがトレーニングデータに反映されている人間の偏見や社会的不平等を体系化する方法です。 これらの懸念は、そのようなシステムのトレーニングに使用されるデータの多様性の欠如が実際の世界に悪影響を与えるという複数の例によって裏付けられています。 

2018で、 MITとMicrosoftの研究論文 大手テクノロジー企業が販売する顔認識システムは、肌の色が濃い人を識別するときにエラー率が大幅に高くなるという問題がありました。これは、主に白人男性で構成されるトレーニングデータセットに起因する問題です。

別の XNUMX年後に勉強する AmazonのRekognition顔認識システムには、肌の色が濃い個人の性別を特定する際に問題があったことを強調しました。 アマゾンの幹部が異議を唱えた料金、促す アマゾンの反論で提起されたポイントに対処する研究者の一人.

調査が発表されて以来、主要なテクノロジー企業の多くは、少なくとも一時的に、警察への顔認識システムの販売を停止しました。

不十分に変化したトレーニングデータの偏った結果の別の例は、2018年に見出しになりました アマゾンは、男性の応募者を好ましいと特定した機械学習の採用ツールを廃止しました。 今日、研究は進行中です 自己学習システムのバイアスを相殺する方法に.

AIと地球温暖化

機械学習モデルとそれらのトレーニングに使用されるデータセットのサイズが大きくなると、これらのモデルを形成して実行する広大なコンピューティングクラスターのカーボンフットプリントも大きくなります。 これらのコンピューティングファームへの電力供給と冷却による環境への影響は次のとおりです。 2018年の世界経済フォーラムによる論文の主題。 One 2019年の見積もりでは、機械学習システムに必要な電力は3.4か月ごとにXNUMX倍になっています.

強力な機械学習モデルをトレーニングするために必要な膨大な量のエネルギーの問題は 言語予測モデルGPT-3のリリースにより、最近注目を集めました、約175億個のパラメータを持つ広大なニューラルネットワーク。 

このようなモデルのトレーニングに必要なリソースは膨大であり、大部分は大企業のみが利用できますが、一度トレーニングすると、これらのモデルの実行に必要なエネルギーは大幅に少なくなります。 しかし、これらのモデルに基づくサービスの需要が高まるにつれ、消費電力とそれに伴う環境への影響が再び問題になります。

XNUMXつの議論は、より大きなモデルのトレーニングと実行による環境への影響です。 潜在的な機械学習と比較検討する必要があり、大きなプラスの影響を与える必要がありますたとえば、GoogleDeepMindのAlphaFold2による画期的な進歩に続いて、ヘルスケアの急速な進歩が見込まれます。

AIは私たち全員を殺しますか?

繰り返しますが、それはあなたが誰に尋ねるかによります。 AIを利用したシステムの機能が向上するにつれて、マイナス面の警告はより悲惨なものになりました。

テスラと SpaceXのCEO、イーロン・マスクが主張した AIは「人類の文明の存在に対する根本的なリスク」です。 AIの欠点を軽減するためのより強力な規制監督とより責任ある研究を推進する一環として、彼はOpenAIを設立しました。これは、社会全体に利益をもたらす友好的なAIの促進と開発を目的とした非営利の人工知能研究会社です。 同様に、尊敬されている物理学者のスティーブンホーキングは、十分に高度なAIが作成されると、 人間の能力を大幅に超えるところまで急速に進歩します。 現象は特異点として知られており、人類に実存的な脅威をもたらす可能性があります。

それでも、人類が私たちの知性を矮小化するAI爆発の危機に瀕しているという考えは、一部のAI研究者にはばかげているように思われます。

英国ケンブリッジにあるマイクロソフトのリサーチディレクター、クリスビショップ 今日のAIの狭い知性が人間の一般的な知性とどれほど違うかを強調します、「ターミネーターやマシンの台頭などが気になる時は? まったくナンセンスです、はい。 せいぜい、そのような議論は数十年先にあります。」

AIはあなたの仕事を盗みますか?

14-amazon-kiva.png

Amazon

現代の肉体労働の多くを人工知能システムに置き換える可能性は、おそらくより信頼できる近い将来の可能性です。

AIがすべての仕事に取って代わるわけではありませんが、確かなことは、AIが仕事の性質を変えることです。唯一の問題は、自動化が職場をどれだけ迅速に、そしてどれほど深く変えるかということです。

AIが影響を与える可能性がないという人間の努力の分野はほとんどありません。 として AIの専門家AndrewNgが言う:「多くの人が日常的で反復的な仕事をしています。 残念ながら、テクノロジーは日常的な反復作業の自動化に特に優れています」と彼は述べ、「今後数十年にわたって技術的失業の重大なリスクがある」と述べています。

どの仕事が取って代わられるかという証拠が現れ始めています。 現在27あります Amazon Go 顧客が棚から商品を取り出して米国に出かけるだけの店舗やレジのないスーパーマーケット。 これが、レジ係として働く米国のXNUMX万人以上の人々にとって何を意味するのかはまだわかっていません。 アマゾンは再び、倉庫内の効率を改善するためにロボットを使用する方法をリードしています。 これらは ロボットは製品の棚を人間のピッカーに運びます 発送するアイテムを選択する人。 Amazonのフルフィルメントセンターには200万を超えるボットがあり、さらに追加する予定です。 しかし、Amazonはまた、ボットの数が増えるにつれて、これらの倉庫にいる人間の労働者の数も増えることを強調しています。 ただし、Amazonと 小さなロボット会社は、倉庫内の残りの手動ジョブの自動化に取り組んでいますですから、手作業とロボット作業が密接に関連して成長し続けることは当然のことです。

完全自動運転車はまだ現実的ではありませんが、いくつかの予測によれば、 自動運転トラック業界 宅配便業者やタクシー運転手への影響を考慮しなくても、単独で次の1.7年間でXNUMX万人以上の仕事を引き受ける準備ができています。

それでも、自動化するのが最も簡単な仕事のいくつかは、ロボット工学さえ必要としません。 現在、ソフトウェアがシステムの自動更新と重要な情報のフラグ付けに優れているため、管理、システム間でのデータの入力とコピー、企業の予定の追跡と予約に何百万人もの人々が働いているため、管理者の必要性は低くなります。

すべての技術シフトと同様に、失われたものを置き換えるために新しい雇用が創出されます。 でも、 不確かなのは、これらの新しい役割が十分に迅速に作成されるかどうかです 避難民に雇用を提供し、新たに失業者がこれらの新たな役割を果たすために必要なスキルや気質を持っているかどうか。

誰もが悲観論者というわけではありません。 いくつかのための、 AIは、労働者に取って代わるのではなく、増強するテクノロジーです。 それだけでなく、AI支援の労働者として、人々を完全に置き換えないという商業上の義務があると彼らは主張しています—クライアントが求める前にクライアントが何を望んでいるのかを正確に伝えるARヘッドセットを備えた人間のコンシェルジュを考えてください— AIが単独で動作するよりも生産的または効果的です。

AIの専門家の間では、人工知能システムが人間の能力をどれだけ早く超えるかについて、幅広い意見があります。

オックスフォード大学のヒューマニティインスティテュートの未来 数百人の機械学習の専門家にAI機能の予測を依頼しました 今後数十年にわたって。

注目すべき日付には、2026年までに人間が書くために通過する可能性のあるAI執筆エッセイ、2027年までにトラック運転手が冗長化される、2031年までに小売業で人間の能力を超えるAI、2049年までにベストセラーを書くこと、2053年までに外科医の仕事をすることが含まれていました。

彼らは、AIが45年以内にすべてのタスクで人間を打ち負かし、120年以内にすべての人間の仕事を自動化する可能性が比較的高いと推定しました。

全て表示:

IBMは、読解、FAQ抽出のためのワトソンツールを追加します.

関連カバレッジ

MLとAIがビジネスインテリジェンスと分析をどのように変革するか
XNUMXつの分野での機械学習と人工知能の進歩により、データの準備、発見、分析、予測、データ主導の意思決定が容易になります。

レポート:人工知能は雇用を創出し、経済的利益を生み出しています
デロイトの新しい研究によると、コグネティブテクノロジーの早期採用者は、現在および将来の役割について前向きであることが示されています。

AIと仕事:人間がアルゴリズムよりも優れている場合、またはその逆の場合
人工知能が何百万もの仕事を一掃するという悲惨な予測に巻き込まれるのは簡単です。 これがリアリティチェックです。

人工知能が新しいタイプのサイバー犯罪をどのように解き放っているのか (TechRepublic)
犯罪者は、銀行を奪うためにマスクの後ろに隠れるのではなく、攻撃を行うために人工知能の後ろに隠れています。 ただし、金融機関はAIを使用してこれらの犯罪と戦うこともできます。

イーロンマスク:人工知能は第三次世界大戦を引き起こす可能性があります (CNET)
シリアルCEOはすでに明日の空想科学小説の戦いを戦っています、そして彼は何よりもキラーロボットについてもっと心配しています。

PlatoAi。 Web3の再考。 増幅されたデータインテリジェンス。
アクセスするには、ここをクリックしてください。

出典:https://www.zdnet.com/article/what-is-ai-heres-everything-you-need-to-know-about-artificial-intelligence/#ftag=RSSbaffb68

スポット画像

最新のインテリジェンス

スポット画像