ゼファーネットのロゴ

Bundesliga Match Fact Win Probability: AWS の機械学習を使用して、ゲーム内イベントが勝利のチャンスに与える影響を定量化する

日付:

今から XNUMX 年後、クラブの技術的適合性は、クラブの成功に大きく貢献するでしょう。 今日、私たちはサッカーの理解に革命を起こすテクノロジーの可能性を目の当たりにしています。 xゴール あらゆる射撃状況のゴール得点の可能性を定量化し、比較できるようにします。 x脅威 & EPV モデルは、ゲーム内のあらゆる瞬間の価値を予測します。 最終的に、これらおよびその他の高度な統計が果たす目的は XNUMX つです。それは、誰がなぜ勝つのかについての理解を深めることです。 新しいブンデスリーガ マッチ ファクト: Win Probability を入力してください。

昨シーズンのバイエルンのボーフムとの 1 度目の試合で、形勢は予想外に変わりました。 試合開始早々、レヴァンドフスキがわずか 0 分で 9:7 の得点を挙げました。 リーグの「グレイマウス」は、そのシーズンに初めてバイエルンと対戦したとき、0:5 の大惨事をすぐに思い出しました。 しかし、今回はそうではありません。クリストファー・アントウィ・アジェイが、わずか38分後にクラブでの最初のゴールを決めました。 4 分にペナルティ ゴールを決めた後、モナコ ディ ババリアのチームは麻痺しているように見え、事態は悪化し始めました: ガンボア ナツメグ コマンがゴールの完全なコーカーで終了し、ホルトマンがディッパーで 1:1975 のハーフタイムに近づきました。左から。 バイエルンは 4 年以来、前半にこれほど多くのゴールを決めたことがなく、2:XNUMX の結果でかろうじて立ち去ることができませんでした。 誰がそれを推測できたでしょうか? どちらのチームも最初のキーパーなしでプレーしたため、バイエルンにとってはキャプテンのマヌエル ノイアーを逃したことを意味しました。 彼の存在は、この予期せぬ結果から彼らを救うことができたでしょうか?

同様に、ケルンは 2020/2021 シーズンに 18 つの並外れたジンガーを引き離しました。 ドルトムントと対戦したとき、彼らは 23 試合で勝利を収めることができませんでしたが、BVB のハーランドはそのシーズンのゴール数でマスター クラス (22 試合で 9 ゴール) を提供していました。 本命の役割は明らかだったが、ケルンはわずか 0 分で早い段階でリードを奪った。 後半開始時、スキリーは最初のゴールと同じ 2:1 のゴールを決めました。 ドルトムントは攻撃力を抑え、大きなチャンスを作り、2:5 の得点を挙げました。 すべてのプレーヤーの中で、ハーランドは延長戦の 3 分後にシッターを逃し、ほぼ 30 年ぶりにドルトムントで最初の XNUMX ポイントを獲得してケルンに冠をつけました。

そのシーズンの後半、ホームテーブルで最後にいたケルンは、チャンピオンシップリーダーのバイエルンに近づくためのすべての動機を持っていたRBライプツィヒを驚かせました。 対戦相手のライプツィヒは、前半にゴールで 13 ショットというチームのシーズン記録で「ビリー ゴーツ」にプレッシャーをかけ、すでに高い勝利の可能性を高めました。 皮肉なことに、ケルンは 1 分にゴールへの最初のシュートで 0:46 を記録しました。「レッドブルズ」が当然の同点ゴールを決めた後、わずか 80 秒後にスローインで眠り、ジョナス ヘクターがケルンの得点を挙げました。また。 ドルトムントと同じように、ライプツィヒは攻撃にすべてのエネルギーを注ぎましたが、彼らが達成した最高のものは延長戦でのポストへのヒットでした。

これらすべての試合で、専門家も初心者も同じように勝者を誤って推測した可能性があります。 しかし、これらの驚くべきゲーム内の勝率の変動につながったイベントは何ですか? 負け組の勝利のチャンスが、時間切れになった本命のチームを追い抜いたのは何分ですか? ブンデスリーガと AWS は協力して、試合中の勝利チャンスのライブ展開を計算して説明し、ファンが確率変動の重要な瞬間を確認できるようにしました。 その結果が、機械学習 (ML) を利用した新しいブンデスリーガ マッチ ファクト: 勝利確率です。

システムを教えてください。

新しいブンデスリーガ マッチ ファクトの勝利確率は、1,000 を超える過去の試合を分析した ML モデルを構築することによって開発されました。 ライブ モデルは、試合前の見積もりを取得し、結果に影響を与える次のような特徴に基づいて、試合の進行に従って調整します。

  • 目標
  • 罰則
  • レッドカード
  • 置換
  • 時は過ぎた
  • ゴールチャンスが生まれた
  • セットプレーの状況

ライブ モデルは、ニューラル ネットワーク アーキテクチャを使用してトレーニングされ、ポアソン分布アプローチを使用して、XNUMX 分あたりのゴール数を予測します。 r 次の式で説明されているように、各チームについて:

これらのレートは、チームの強さの推定値と見なすことができ、入力に基づく一連の密なレイヤーを使用して計算されます。 これらのレートと対戦相手の差に基づいて、勝敗の確率がリアルタイムで計算されます。

モデルへの入力は、入力機能、現在の目標差、残りのプレイ時間 (分単位) の 3 タプルです。

15 つの入力ディメンションの最初のコンポーネントは、パフォーマンス メトリックで両チームの現在のゲーム アクションをリアルタイムで説明する機能セットで構成されます。 これらには、予測前の過去 25 分間に撮影されたショットに特に注意を払って、集計されたチームベースのさまざまな xG 値が含まれます。 また、レッド カード、ペナルティ、コーナー キック、危険なフリー キックの数も処理します。 危険なフリー キックは、対戦相手のゴールから XNUMX m 以内にあるフリー キックとして分類されます。 モデルの開発中に、以前のブンデスリーガ マッチ ファクト xGoals の影響に加えて、モデルにおけるブンデスリーガ マッチ ファクト スキルの影響も評価しました。 これは、モデルがトップ プレーヤー (スキル フィニッシャー、イニシエーター、またはボール ウィナーのバッジを持つプレーヤー) の置換に反応することを意味します。

勝率の例

今シーズン(2022/2023)の試合を見てみましょう。 以下のグラフはバイエルン・ミュンヘンとシュツットガルトの試合の第6節からの勝率を示しています。

試合前のモデルでは、バイエルンの勝率は 67%、シュトゥットガルトの勝率は 14%、引き分けの勝率は 19% と計算されました。 試合の流れを見ると、36分、57分、60分にゴールが大きく影響しています。 延長戦の最初の 2 分間まで、バイエルンのスコアは 1:90 でした。 2分+5分にS.グラッシーが成功したペナルティショットのみが引き分けを確保しました。 そのため、勝率ライブ モデルは引き分けの予測を 90% から 90% 以上に修正しました。 その結果、バイエルンの勝率は 8+90 分で 2% から XNUMX% に低下し、予期せぬ終盤のスイングとなりました。 グラフは、その日のアリアンツ アレーナの雰囲気の変化を表しています。

それはどのように実装されていますか?

Win Probability は、進行中の試合 (ゴール イベント、ファウル、レッド カードなど) からのイベント データと、xGoals などの他のマッチ ファクトによって生成されたデータを消費します。 確率のリアルタイム更新には、 アマゾンマネージドストリーミングカフカ (Amazon MSK) を中心的なデータ ストリーミングおよびメッセージング ソリューションとして使用します。 このようにして、イベント データ、ポジション データ、およびさまざまなブンデスリーガ マッチ ファクトの出力を、コンテナ間でリアルタイムに通信できます。

次の図は、Win Probability のエンド ツー エンドのワークフローを示しています。

収集された試合関連データは、外部プロバイダー (DataHub) を通じて取り込まれます。 試合のメタデータが取り込まれ、 AWSラムダ 関数。 ポジションとイベントのデータは、 AWSファーゲート コンテナ (MatchLink)。 取り込まれたすべてのデータは、それぞれの MSK トピックで使用するために公開されます。 Win Probability Match Fact の心臓部は、専用の Fargate コンテナ (BMF WinProbability) にあり、それぞれの試合中に実行され、Amazon MSK を通じて取得されたすべての必要なデータを消費します。 ML モデル (ライブおよび試合前) は、 アマゾンセージメーカー サーバーレス推論エンドポイント。 サーバーレス エンドポイントは、コンピューティング リソースを自動的に起動し、受信トラフィックに応じてそれらのコンピューティング リソースをスケーリングするため、インスタンス タイプを選択したり、スケーリング ポリシーを管理したりする必要がなくなります。 この従量制モデルを使用するサーバーレス推論は、トラフィックの急増の間にアイドル期間があるワークロードに最適です。 ブンデスリーガの試合がない場合、アイドル リソースのコストは発生しません。

キックオフの少し前に、特徴の初期セットを生成し、PreMatch SageMaker エンドポイントを呼び出して試合前の勝利確率を計算します。 これらの PreMatch 確率を使用して、ライブ モデルを初期化し、関連するゲーム内イベントにリアルタイムで反応し、現在の勝率を取得するために継続的にクエリを実行します。

計算された確率は DataHub に送り返され、他の MatchFacts コンシューマーに提供されます。 確率は、MSK クラスターの専用トピックにも送信され、他のブンデスリーガ マッチ ファクトで使用されます。 Lambda 関数は、それぞれの Kafka トピックからすべての確率を消費し、それらを アマゾンオーロラ データベース。 このデータは、インタラクティブなほぼリアルタイムの視覚化に使用されます。 アマゾンクイックサイト.

まとめ

この投稿では、新しいブンデスリーガ マッチ ファクトの勝率が、チームが試合に勝ったり負けたりする可能性に対するゲーム内イベントの影響をどのように示すかを示しました。 そのために、以前に公開されたブンデスリーガのマッチ ファクトをリアルタイムで構築し、組み合わせています。 これにより、コメンテーターやファンは、ライブ マッチ中に確率変動の瞬間などを明らかにすることができます。

新しいブンデスリーガ マッチ ファクトは、ブンデスリーガのサッカー専門家と AWS データ サイエンティストによる詳細な分析の結果です。 勝利の確率は、ブンデスリーガの公式アプリの各試合のライブ ティッカーに表示されます。 放送中、当選確率はコメンテーターに提供されます。 データストーリーファインダー 弱者がリードし、ゲームに勝つ可能性が最も高いときなど、重要な瞬間にファンに視覚的に表示されます。

この真新しいブンデスリーガマッチファクトを楽しんでいただき、ゲームへの新しい洞察を提供してくれることを願っています。 AWSとブンデスリーガのパートナーシップの詳細については、次のWebサイトをご覧ください。 AWSのブンデスリーガ!

私たちは、あなたがどのようなパターンを明らかにするかを学ぶことに興奮しています。 あなたの洞察を私たちと共有してください: Twitterの@AWScloud、ハッシュタグ#BundesligaMatchFactsを使用。


著者について

サイモン・ロルフェス ブンデスリーガでセントラル ミッドフィールダーとして 288 試合に出場し、41 ゴールを記録し、ドイツ代表として 26 キャップを獲得しました。 現在、ロルフェスはバイエル 04 レバークーゼンのスポーツ担当マネージング ディレクターを務めており、プロ選手名簿、スカウト部門、クラブのユース開発を監督および開発しています。 サイモンは毎週のコラムも書いています ブンデスリーガ.com AWS を利用した最新のブンデスリーガの試合の事実について。 そこで彼は、元選手、キャプテン、テレビ アナリストとしての専門知識を提供し、高度な統計と機械学習がサッカーの世界に与える影響を強調しています。

タレク・ハシェミ AWS プロフェッショナル サービスのコンサルタントです。 彼のスキルと専門分野には、アプリケーション開発、データ サイエンス、機械学習、ビッグ データが含まれます。 彼は、顧客がクラウド内でデータ駆動型アプリケーションを開発するのをサポートしています。 AWS に入社する前は、航空や電気通信などのさまざまな業界のコンサルタントも務めていました。 彼は、クラウドへのデータ/AI ジャーニーで顧客を支援することに情熱を注いでいます。

ハビエル・ポベダ-パンター は、AW​​S プロフェッショナル サービス チーム内の EMEA スポーツ顧客のデータ サイエンティストです。 彼は、観戦スポーツの分野の顧客がデータを革新して活用できるようにし、機械学習とデータ サイエンスを通じて高品質のユーザーとファンの体験を提供します。 余暇には、幅広いスポーツ、音楽、AI に情熱を注いでいます。

ルーク・フィグドール は、AW​​S プロフェッショナル サービス チームのスポーツ テクノロジー アドバイザーです。 彼はプレーヤー、クラブ、リーグ、ブンデスリーガやフォーミュラ 1 などのメディア企業と協力して、機械学習を使用したデータでストーリーを伝える手助けをしています。 余暇には、心と、心理学、経済学、AI の交差点について学ぶのが好きです。

ガブリエル・ジルカ AWS プロフェッショナル サービスの機械学習エンジニアです。 彼は顧客と緊密に連携して、クラウド導入の旅を加速させています。 MLOps ドメインを専門とする彼は、エンドツーエンドの機械学習ライフサイクルを自動化し、望ましいビジネス成果の達成を支援することで、機械学習ワークロードの生産化に注力しています。

ヤクブ・ミハルチク は、Sportec Solutions AG のデータ サイエンティストです。 数年前、彼はサッカーをするよりも数学の研究を選びました。彼は後者が十分に得意ではないという結論に達したからです。 現在、彼はプロとしてのキャリアの中で、この両方の情熱を組み合わせて、機械学習手法を適用してこの美しいゲームについてより良い洞察を得ています。 余暇には、今でも XNUMX 人制のフットボールをしたり、犯罪映画を見たり、映画音楽を聴いたりしています。

スポット画像

最新のインテリジェンス

スポット画像

私たちとチャット

やあ! どんな御用でしょうか?