ゼファーネットのロゴ

PGA ツアーの生成 AI 仮想アシスタントの旅、コンセプトから開発、プロトタイプまで |アマゾン ウェブ サービス

日付:

これは、PGA ツアーのスコット ガッターマンとの共著によるゲスト投稿です。

生成型人工知能 (Generative AI) は、インテリジェント システムの構築に新たな可能性をもたらしました。 Generative AI ベースの大規模言語モデル (LLM) の最近の改良により、情報検索を取り巻くさまざまなアプリケーションでの使用が可能になりました。データ ソースを考慮すると、LLM は、以前は何年もかかり、おそらくパフォーマンスも悪かった Q&A チャットボットを数週間で構築できるツールを提供してくれました。私たちは、PGA ツアーが会話形式のインタラクティブな方法でデータにアクセスできる将来のファン エンゲージメント プラットフォームのプロトタイプを作成できる検索拡張生成 (RAG) ソリューションを策定しました。

構造化データを使用して質問に答えるには、ユーザーのクエリに関連するデータを効果的に抽出する方法が必要です。私たちは、ユーザーの自然言語クエリを LLM を使用して SQL ステートメントに変換する text-to-SQL アプローチを策定しました。 SQL は次によって実行されます。 アマゾンアテナ 関連するデータを返します。このデータは再び LLM に提供され、LLM はデータを与えられたユーザーのクエリに答えるように求められます。

テキスト データを使用するには、ユーザーのクエリに答えるために、関連するコンテキストを検索して LLM に提供するために使用できるインデックスが必要です。迅速な情報検索を可能にするために、 アマゾンケンドラ これらのドキュメントのインデックスとして。ユーザーが質問すると、仮想アシスタントは Amazon Kendra インデックスを迅速に検索して関連情報を見つけます。 Amazon Kendra は自然言語処理 (NLP) を使用してユーザーのクエリを理解し、最も関連性の高いドキュメントを見つけます。その後、関連情報が最終応答生成のために LLM に提供されます。私たちの最終的なソリューションは、これらの text-to-SQL アプローチと text-RAG アプローチを組み合わせたものです。

この投稿では、 AWS ジェネレーティブ AI イノベーション センター と協力しました AWSプロフェッショナルサービス & PGA TOUR を使用してプロトタイプの仮想アシスタントを開発します。 アマゾンの岩盤 これにより、ファンはあらゆるイベント、プレーヤー、ホール、ショットレベルの詳細に関する情報をシームレスなインタラクティブな方法で抽出できるようになります。 Amazon Bedrock は、AI21 Labs、Anthropic、Cohere、Meta、Stability AI、Amazon などの大手 AI 企業の高性能基盤モデル (FM) を単一の API 経由で提供するフルマネージド サービスです。セキュリティ、プライバシー、責任ある AI を備えた生成 AI アプリケーションを構築するために必要な機能。

開発: データの準備

他のデータドリブン プロジェクトと同様に、パフォーマンスはデータに応じて向上します。 LLM が関連データを効果的にクエリして取得できるようにデータを処理しました。

表形式の競合データでは、最大数のユーザー クエリに関連するデータのサブセットに焦点を当て、LLM が理解しやすいように列に直感的にラベルを付けました。また、LLM が他の方法で苦労する可能性のある概念を理解するのに役立ついくつかの補助的な列も作成しました。たとえば、ゴルファーがパーより 3 ショット少ないショットを打った場合 (パー 4 では 4 ショットでホールインする、またはパー 5 では XNUMX ショットでホールインするなど)、それは一般的に「パー」と呼ばれます。 バーディー。ユーザーが「プレーヤー X は昨年何バーディをとりましたか?」と尋ねた場合、スコアとパーを表に記載するだけでは十分ではありません。その結果、ボギー、バーディ、イーグルなどの一般的なゴルフ用語を示す列を追加しました。さらに、コンペティション データを別のビデオ コレクションにリンクしました。 video_idこれにより、アプリはコンペティション データ内の特定のショットに関連付けられたビデオを取得できるようになります。また、各選手の経歴をテキスト列として追加するなど、テキスト データを表形式データに結合できるようにしました。次の図は、text-to-SQL パイプラインでクエリがどのように処理されるかを段階的に示しています。数字は、クエリに回答するための一連の手順を示します。

次の図では、エンドツーエンドのパイプラインを示しています。を使用しております AWSラムダ オーケストレーション機能として、さまざまなデータ ソース、LLM との対話、およびユーザー クエリに基づくエラー修正を担当します。ステップ 1 ~ 8 は、前の図に示されているものと同様です。非構造化データについては若干の変更がありますが、これについては次に説明します。

テキスト データには、トピックの一貫性を維持しながら、長い文書を LLM が消化できる部分に分割 (またはセグメント化) する独自の処理手順が必要です。私たちはいくつかのアプローチを実験し、メディア ガイドの形式とよく調和するページ レベルのチャンク スキームに落ち着きました。私たちは Amazon Kendra を使用しました。これは、埋め込みの仕様を必要とせずにドキュメントのインデックス付けを処理し、取得のための簡単な API を提供するマネージド サービスです。次の図は、このアーキテクチャを示しています。

私たちが開発した統合されたスケーラブルなパイプラインにより、PGA ツアーは 1800 年代にまで遡るデータの全履歴に対応できるようになります。これにより、将来のアプリケーションがコース コンテキストをライブで利用して、豊かなリアルタイム エクスペリエンスを作成できるようになります。

開発: LLM の評価と生成 AI アプリケーションの開発

私たちは、Amazon Bedrock で利用可能なファーストパーティおよびサードパーティの LLM を慎重にテストおよび評価し、パイプラインとユースケースに最適なモデルを選択しました。 Amazon Bedrock で Anthropic の Claude v2 と Claude Instant を選択しました。最終的な構造化データ パイプラインと非構造化データ パイプラインでは、Amazon Bedrock 上の Anthropic の Claude 2 が最終的なデータ パイプラインで全体的により良い結果を生成したことがわかりました。

プロンプトは、LLM が希望どおりにテキストを出力できるようにするための重要な側面です。私たちは、タスクごとにさまざまなプロンプトを試してかなりの時間を費やしました。たとえば、テキストから SQL へのパイプラインには、具体性が高まり、テーブル スキーマが徐々に簡素化されたいくつかのフォールバック プロンプトがありました。 SQL クエリが無効で Athena からエラーが発生した場合、エラーと不正な SQL を LLM に渡し、修正を依頼するエラー修正プロンプトを開発しました。 text-to-SQL パイプラインの最後のプロンプトは、LLM に Athena 出力を取得するように要求します。Athena 出力は Markdown または CSV 形式で提供され、ユーザーに回答を提供します。非構造化テキストについては、Amazon Kendra から取得したコンテキストを使用してユーザーの質問に答えるための一般的なプロンプトを開発しました。プロンプトには、Amazon Kendra から取得した情報のみを使用し、LLM 事前トレーニングからのデータに依存しないようにする指示が含まれていました。

生成 AI アプリケーションではレイテンシーが懸念されることがよくありますが、ここでも同様です。これは、最初の SQL 生成 LLM 呼び出しに続いて応答生成 LLM 呼び出しを必要とする text-to-SQL の場合に特に懸念されます。 Anthropic の Claude V2 などの大規模な LLM を使用している場合、たった 2 回の LLM 呼び出しのレイテンシが効果的に XNUMX 倍になります。私たちは、実行時間と正確性を評価するために、大小の LLM のいくつかの構成を実験しました。次の表は、Amazon Bedrock 上の Anthropic の Claude VXNUMX および Claude Instant を使用して生成された応答と、レイテンシーを示す XNUMX つの質問の例を示しています。

試作

このアプリケーションでは、Lambda 関数を使用して、Amazon Athena、Amazon Kendra、Amazon Bedrock 間のプロンプト選択と通信を調整しました。仮想アシスタントは、React と Cloudscape Design System で構築された会話型インターフェイスを備えており、テキストとビデオを使用してユーザーと対話します。

当社のバーチャル アシスタントは、PGA ツアーのイベント、選手、統計、歴史などに関する幅広い質問に答えることができます。たとえば、シュライナーズ チルドレンズ オープン (PGA ツアーの代表的なイベントの 1 つ) でのトニー フィナウの最長ドライブについて質問された場合、アシスタントは構造化データをクエリしてショット レベルのデータを取得できます。 text-to-SQL パイプラインを使用して、彼がこの記録を達成した間の正確な距離 (ヤード)、ラウンド番号、ホールを抽出できます。次に、アシスタントはこの数値データを解釈して最終応答を生成します。次の表には、いくつかの応答例が含まれています。

質問 レスポンス
シュライナーズ・チルドレンズ・オープンでトニー・フィナウが打った最長ドライブは何ですか? トニー・フィナウがシュライナーズ・チルドレン・オープンで打った最長ドライブは、382年の第4ラウンドの2018番ホールで打ったXNUMXヤードだった。
シュライナーズ・チルドレンズ・オープンでコリン・モリカワが打った最長ドライブは何ですか? シュライナーズ・チルドレン・オープンでのコリン・モリカワの最長ドライブは334ヤードだった。これは2019年の第15ラウンドのXNUMX番ホールで起きた。
2022年のシュライナーズチルドレンズオープンでエースを達成した選手はいますか? はい、アダム ハドウィンは、14 シュライナーズ チルドレンズ オープンのラウンド 3 で 2022 番ホールでホールインワンを達成しました

次の説明ビデオでは、仮想アシスタントとの対話例をいくつか紹介します。

初期テストでは、PGA ツアー バーチャル アシスタントがファン エクスペリエンスの向上に大きな期待を寄せています。 text-to-SQL、セマンティック検索、自然言語生成などの AI テクノロジーを組み合わせることで、アシスタントは有益で魅力的な応答を提供します。ファンは、これまで見つけるのが難しかったデータやナラティブに簡単にアクセスできるようになりました。

未来は何を保持していますか?

開発を続けるにつれて、仮想アシスタントが処理できる質問の範囲を拡大していきます。これには、AWS と PGA ツアーの協力による広範なテストが必要になります。私たちは、時間の経過とともに、このアシスタントを、Web、モバイル、音声インターフェイス全体でアクセスできるパーソナライズされたオムニチャネル エクスペリエンスに進化させることを目指しています。

クラウドベースの生成 AI アシスタントの確立により、PGA ツアーはその膨大なデータ ソースを複数の社内外の関係者に提示できるようになります。スポーツ生成 AI の状況が進化するにつれて、新しいコンテンツの作成が可能になります。たとえば、AI と機械学習 (ML) を使用すると、ファンがイベントを視聴しているときに、または制作チームが現在のイベントに一致する以前のトーナメントのショットを探しているときに、見たいコンテンツを表面化できます。たとえば、PGA ツアー チャンピオンシップでマックス ホーマがピンから 20 フィートの地点から最後のショットを打つ準備をしている場合、PGA ツアーは AI と ML を使用して彼のクリップを識別し、AI が生成した解説とともに提示できます。過去にXNUMX回同様のショットを試みた。この種のアクセスとデータにより、制作チームはブロードキャストに即座に価値を追加したり、ファンが見たいデータの種類をカスタマイズしたりできるようになります。

「PGA ツアーは、ファンの体験を向上させるために最先端のテクノロジーを使用する業界のリーダーです。 AI は当社のテクノロジー スタックの最前線にあり、ファンにとってより魅力的でインタラクティブな環境を構築できるようにしています。これは、AWS Generative AI Innovation Center と協力して、革新的なエンドツーエンドの顧客エクスペリエンスを実現するためのジェネレーティブ AI の旅の始まりです。私たちは Amazon Bedrock と独自データを活用して、PGA ツアーファンがイベント、選手、統計、その他のコンテンツに関する興味深い情報をインタラクティブな方法で見つけられるインタラクティブなエクスペリエンスを作成することに取り組んでいます。」
– Scott Gutterman 氏、PGA ツアー放送およびデジタル プロパティ担当シニア バイス プレジデント。

まとめ

この投稿で説明したプロジェクトは、AI を使用して構造化データ ソースと非構造化データ ソースを融合して次世代の仮想アシスタントを作成する方法を例示しています。スポーツ組織にとって、このテクノロジーにより、より没入型のファンとの関わりが可能になり、内部効率が向上します。私たちが明らかにするデータ インテリジェンスは、選手、コーチ、役員、パートナー、メディアなどの PGA ツアーの関係者が情報に基づいた意思決定をより迅速に行うのに役立ちます。スポーツを超えて、私たちの方法論はあらゆる業界で再現できます。同じ原則が、顧客、従業員、学生、患者、その他のエンドユーザーと関わる建築アシスタントにも当てはまります。思慮深い設計とテストにより、事実上すべての組織が、構造化データベース、ドキュメント、画像、ビデオ、その他のコンテンツをコンテキスト化する AI システムの恩恵を受けることができます。

同様の機能の実装に興味がある場合は、使用を検討してください。 Amazon Bedrock のエージェント & Amazon Bedrock のナレッジベース 代替の、完全に AWS マネージドのソリューションとして。このアプローチでは、カスタマイズ可能なエージェントを介したインテリジェントな自動化とデータ検索機能の提供をさらに調査できる可能性があります。これらのエージェントは、ユーザー アプリケーションの対話をより自然、効率的、効果的なものに変える可能性があります。


著者について

スコット・ガッターマン PGA ツアーのデジタル オペレーション担当上級副社長です。彼はツアー全体のデジタル運営、製品開発を担当しており、GenAI 戦略を推進しています。

アサン・アリ Amazon Generative AI Innovation Center の応用科学者であり、さまざまな分野の顧客と協力して、Generative AI を使用して緊急かつ高価な問題を解決しています。

タヒン・シード Amazon Generative AI Innovation Center の応用科学者であり、顧客と協力して、Generative AI ソリューションによるビジネス成果の実現を支援しています。 仕事以外では、新しい食べ物を試すこと、旅行、テコンドーを教えることを楽しんでいます。

グレース ラング は、AW​​S プロフェッショナル サービスのアソシエイト データ & ML エンジニアです。困難な課題を克服したいという情熱に突き動かされ、Grace は機械学習を活用したソリューションを開発することで、お客様の目標達成を支援します。

ジェ・リー ProServe の M&E 部門のシニア エンゲージメント マネージャーです。彼女は、複雑な取り組みを主導して実行し、強力な問題解決スキルセットを示し、利害関係者の期待を管理し、幹部レベルのプレゼンテーションを監修します。彼女はスポーツ、生成 AI、顧客エクスペリエンスに焦点を当てたプロジェクトに楽しく取り組んでいます。

カーン・チャハール は、AW​​S の共有配信チームに所属するセキュリティ コンサルタントです。彼はテクノロジー愛好家であり、顧客と協力してセキュリティの課題を解決し、クラウドでのセキュリティ体制を改善することに喜びを感じています。

マイク・アムジャディ は、AW​​S ProServe のデータおよび ML エンジニアであり、顧客がデータから価値を最大化できるようにすることに重点を置いています。彼は、適切に設計された原則に従ってデータ パイプラインを設計、構築、最適化することを専門としています。マイクはテクノロジーを使用して問題を解決することに情熱を持っており、お客様に最高の結果を提供することに尽力しています。

ヴルシャリ・サワント Proserve のフロントエンド エンジニアです。彼女はレスポンシブなウェブサイトを作成することに非常に熟練しています。彼女は顧客と協力し、顧客の要件を理解し、スケーラブルで導入が簡単な UI/UX ソリューションを提供することが大好きです。

ニーラム・パテル AWS のカスタマー ソリューション マネージャーであり、主要な Generative AI とクラウドの最新化の取り組みを主導しています。ニーラムは主要な経営者やテクノロジー所有者と協力してクラウド変革の課題に対処し、顧客がクラウド導入のメリットを最大化できるよう支援します。彼女は英国のワーウィック ビジネス スクールで MBA を取得し、インドでコンピューター エンジニアリングの学士号を取得しています。

ムラリ・バクタ博士 AWS のグローバル ゴルフ ソリューション アーキテクトであり、ジェネレーティブ AI、データ分析、最先端のクラウド テクノロジーを含む重要な取り組みの先頭に立っています。 Murali は、主要な経営陣やテクノロジー所有者と協力して顧客のビジネス課題を理解し、それらの課題に対処するソリューションを設計します。彼は UConn で金融の MBA を取得し、アイオワ州立大学で博士号を取得しています。

メディ・ヌール ジェネレーティブ AI イノベーション センターの応用科学マネージャーです。 テクノロジーとイノベーションの橋渡しに情熱を持っている彼は、AWS の顧客が Generative AI の可能性を解き放つことを支援し、高度な AI テクノロジーのスケーラブルで測定可能で影響力のある使用に焦点を当て、その道筋を合理化することで、潜在的な課題を迅速な実験とイノベーションの機会に変えています。生産へ。

スポット画像

最新のインテリジェンス

スポット画像