ゼファーネットのロゴ

企業における生成 AI を再考する時期が来た理由 – DATAVERSITY

日付:

最近、生成 AI (GenAI) テクノロジーの進化に注目している場合は、その中心となる概念、つまり GenAI モデルがどのように機能するか、プロンプトを作成する技術、および GenAI モデルが依存するデータの種類についてよくご存じかと思います。 。

GenAI 内のこれらの基本コンポーネントは不変ですが、それらの適用方法は変わりつつあります。 2022 年後半の ChatGPT の台頭で注目を集めた GenAI へのアプローチは、企業が GenAI を活用して新しいビジネス機能を実現する際に採用するアプローチと同じである可能性は低いです。

生成 AI を取り巻くこれらの概念がどのように進化しているのか、そしてこの変化がビジネスの世界における GenAI の将来に何を意味するのかを詳しく見ていきましょう。

生成 AI に対する従来のアプローチ

GenAI の核となる基本要素は次のように要約できます。

  • 基礎モデル: 基盤モデルは、さまざまな用途に対応できる GenAI モデルです。現在まで、OpenAI によって開発された GPT モデルなど、少数の GenAI モデルがこの分野を独占してきました。
  • 日付: モデルはトレーニング目的でデータに依存します。従来、そのデータは主に次の形式をとっていました。 非構造化データこれは、基礎モデルのベンダー (やはり OpenAI など) がモデルを一般に公開する前に事前トレーニングするために使用されていました。
  • 迅速なエンジニアリング: プロンプト エンジニアリングは、GenAI モデルから適切な応答を生成するプロンプトを考案するプロセスです。事前トレーニングされた基礎モデルの使用では、それらのモデルのデータやコンテキストをカスタマイズする機会があまり提供されないため、AI モデルが特定のユースケースをサポートできるようにするには、迅速なエンジニアリングが重要です。データやモデル自体を制御することはできませんが、そこに入力するプロンプトを制御することはできます。

つまり、ここ 1 年半ほどの GenAI エコシステムは、カスタム プロンプト エンジニアリングに大きく依存するユースケースに対処するために、非構造化データの汎用セットで事前トレーニングされたサードパーティの基盤モデルによって支配されてきました。この世界では、基礎モデルを構築したベンダーが本質的に門番でした。モデルがどのように機能するか、どのデータでトレーニングされたかに関するベンダーの決定が、モデルの使用方法に関する制約を設定するからです。

エンタープライズ生成 AI のイノベーション

将来に目を向けると、このアプローチはいくつかの重要な点で変化する予定です。

1. カスタム基盤モデル

最大の変化の 1 つは、生成 AI サービスを専門とする企業が提供するものを超えた基盤モデルの可用性が増加していることです。

Meta や Google などの企業がリリースしたオープンソース モデルに加えて、現在では SAP などのベンダーが独自の基盤モデルを開発しているのが見られます。重要なことは、これらのモデルは、モデルが動作するコンテキストを制御する独自のパラメーターを注入することにより、企業が運用をカスタム モデル化する機会を増やすことになります。場合によっては、カスタム データでモデルをトレーニングまたは再トレーニングすることもできます。

ここで重要なのは、新世代の基盤モデルにより、企業は生成 AI の活用方法をより細かく制御できるようになっているということです。特定のユースケース向けに設計されていない汎用モデルに満足する必要はもうありません。その代わりに、データ エンジニアリング機能があれば、モデルの動作を広範な方法でカスタマイズできます。

2. 構造化データの使用

これまで、GenAI モデルはドキュメントや Web ページなどの非構造化データを主にトレーニングしていました。これは、モデルの設計者の主な目標が、ユーザーがこれらのドキュメント内のデータを検索または要約できるようにすることであったためです。基本的に、OpenAI によって開発されたような GenAI モデルは、Web の代替検索インターフェイスです。

これは依然としてビジネスにおける GenAI の重要なユースケースの 1 つです。さらに新たなユースケースとして、データベースに保存されている情報などの構造化データをクエリするためのインターフェイスとして GenAI を活用するというものもあります。企業は、Amazon Q などのソリューションを使用してこれをすでに行うことができます。

これは、GenAI が企業が所有する膨大な量の構造化データを解釈する能力を強化できることを示しているため、重要です。以前は、このデータに基づいて質問に対処するには、専門のデータ アナリストが複雑なクエリを手動で作成し、レポートを生成する必要がありました。現在、GenAI は、最も熟練したデータ アナリストでさえ達成できる速度よりもはるかに速い速度でその作業を実行できるようになりました。

3. データディスパッチャの出現

AI モデルをビジネス内に存在するすべてのデータと統合することは、特にどのデータセットが特定のユースケースに最も関連しているかが不明瞭であることが多いため、複雑な作業です。たとえば、販売データをクエリする場合、ERP システム、CRM、手動で作成したスプレッドシート、またはその他のデータからのデータを使用してモデルをプロンプトする必要がありますか?

この問題に取り組むために、企業はおそらく、私が「データ ディスパッチャー」と呼ぶものを採用するでしょう。データ ディスパッチャーは、効率的な方法でデータを GenAI サービスに公開する統合ツールであり、企業がカスタム モデルのトレーニングにデータを簡単に活用できるようにします。企業は、AI トレーニングに必要なデータの決定を強制するのではなく、この作業を処理するデータ ディスパッチャに頼ることになります。

これにより、データ ディスパッチャ ベンダーは GenAI 環境の新たな門番となる立場に置かれます。権限は、AI モデルを開発するベンダーから、プロンプトをサポートするためにどのデータを利用できるかに影響を与えるベンダーに移ります。

民主化されたデータ中心の GenAI ランドスケープに向けて?

最終的に、これらの変化は、すでに進行中ですが、企業が GenAI の使用方法をより正確に制御できるようになるという意味で、GenAI をより民主的にすることを約束します。

同時に、データ、特に特定の企業が所有する独自データの重要性がこれまで以上に高まっています。企業は、少数の AI モデル ベンダーとそのベンダーがトレーニングに使用することを決定したデータに依存するのではなく、データ ディスパッチャーの助けを借りて、どの情報が GenAI ツールとサービスを可能にするかを決定できるようになります。

この素晴らしい新しい世界で成功するには、データを効果的に管理および統治する能力が鍵となります。 データ管理 は企業にとって長い間重要でしたが、企業が GenAI を取り巻く新たな機会を活用したい場合は、企業がデータを使用してカスタム GenAI ユースケースを実現できるように、前例のないレベルのデータ制御が必要になります。 

その議論は現在行われており、今後数か月、数年にわたって監視する鍵となるでしょう。

スポット画像

最新のインテリジェンス

スポット画像