제퍼넷 로고

Bundesliga Match Facts xGoals의 기술 : 머신 러닝이 축구에서 데이터 중심 통찰력을 얻는 방법

시간

축구 경기를 보는 것이 일반적이며, 플레이어가 골을 넣는 것을 볼 때 그 골이 얼마나 어려운지 추측합니다. TV에서 경기를 시청하고 있다면 방송사에서 그 샷이 그물의 뒷면을 찾는 것이 얼마나 힘든지 소리를 들으면 의견이 더 확인 될 수 있습니다. 이전에는 육안으로 볼 수 있었고 현재 수비수, 골키퍼의 위치 또는 선수가 그물 앞에 있거나 측면으로 기울어 진 경우를 기반으로 한 가정으로 채색되었습니다. 이제 AWS가 제공하는 Bundesliga Match Facts 중 하나 인 xGoals ( "예상 목표"의 약자)를 통해 와우 팩터 뒤에 데이터와 통찰력을 넣을 수 있습니다. 경기장의 어떤 위치.

Deutsche Fußball Liga (DFL)는 독일의 프로 축구 리그 인 Bundesliga와 Bundesliga 2의 조직 및 마케팅을 책임지고 있습니다. DFL은 매 경기마다 3.6 만 개 이상의 데이터 포인트를 수집하여 경기장에서 일어나는 일에 대한 심층적 인 통찰력을 제공합니다. 비전은 전 세계 500 억 명 이상의 분데스리가 팬들과 70 개 이상의 미디어 파트너들의 경험을 향상시켜 가장 혁신적인 스포츠 리그가되는 것입니다. DFL은 머신 러닝 (ML)에 의해 구동되는 실시간 통계를 제공하고 팬을위한 맞춤형 컨텐츠를 구축하며 데이터를 통찰력과 행동으로 바꾸는 새로운 방식으로 기술을 사용하여 비전을 달성하는 것을 목표로합니다.

xGoals는 DFL과 AWS의 두 가지 새로운 일치 사실 (평균 위치가 두 번째 임) 중 하나입니다. 2020 년 XNUMX 월 말에 공식적으로 출시되었습니다. 독일의 분데스리가, 독일 최고의 축구 리그, 경기당 평균 골 수가 가장 많은 리그와의 전 세계 팬 참여도 향상. 사용 아마존 세이지 메이커ML 모델을 구축, 교육 및 배포하기 위해 완벽하게 관리되는 서비스 인 xGoals는 분데스리가 플레이어가 경기장의 어느 위치에서든 촬영할 때의 득점 점수를 객관적으로 평가할 수 있습니다. xGoals는 또한 패스가 더 나은 기회를 제공하는 데 도움이되는지 여부를 판단 할 수 있습니다.

xGoals와 다른 Bundesliga Match Facts는 축구 세계에서 데이터 중심 통찰력을 제공함으로써 새로운 표준을 세우고 있습니다.

목표 득점 기회 수량화

xGoals Match Facts는 전 세계 26여 개국에서 방송 된 Borussia Dortmund vs. FC Bayern Munich 시합에서 2020 년 200 월 6 일에 데뷔했습니다. FC 바이에른 뮌헨의 조슈아 킴 미치 (Joshua Kimmich)는 조금만 포기하고 모든 것을 위해 싸워야 할 경기에서 놀라운 기회를 잡았습니다. 목표까지의 거리, 스트라이크 각도, 주변 선수 수 및 기타 요인을 고려할 때이 특정 상황에서의 목표 득점 확률은 XNUMX %에 불과했습니다.

xGoals ML 모델은 0과 1 사이의 확률 수치를 생성 한 후 값이 백분율로 표시됩니다. 예를 들어, 분데스리가 경기에서 훈련 된 ML 모델의 평가에 따르면 모든 페널티 킥은 xGoals (또는 "xG") 값이 0.77 인 것으로 나타났습니다. 즉, 득점 점수는 77 %입니다. xGoals는 선수 나 팀의 득점 득점 기회를 질적으로 측정하여 그 성과에 대한 정보를 제공하는 가치를 소개합니다.

각 경기가 끝나면 두 팀의 xGoals 값 집계도 표시됩니다. 이런 방식으로 시청자는 목표 득점 기회에 대한 객관적인 지표를 얻습니다. 이전에 언급 된 특정 경기는 Kimmich가 한 번의 성공을 거두지 못하면 무승부 확률이 높았습니다. xGoals는 시청 경험을 향상시키고 여러 가지 방법으로 통찰력을 제공하여 팬의 참여를 유지하고 경기 또는 시즌 내내 플레이어와 팀의 잠재력을 이해할 수 있도록합니다.

목표 이전의 득점 시도와 관련하여 매우 역동적 인 상황에서 xG 값을 70 % 이상으로 달성하기는 매우 어렵습니다. 플레이어의 위치는 지속적으로 변하고 플레이어는 대부분 직관에 의존하여 제한된 정보로 초 단위 결정을 내려야합니다. 따라서, 목표에 근접하여 위치하더라도 상황에 따라 점수를 매기는 어려움이 크게 다를 수 있습니다. 그러므로, 주어진 순간에 경기장에서 모든 이벤트를 데이터 중심의 전체적인 관점으로 보는 것이 중요합니다. 그래야만이 정보를 xGoals ML 모델에 공급할 때 다른 플레이어의 위치를 ​​고려하여 정확한 예측을 할 수 있습니다.

그것은 모두 데이터로 시작

경기 사실에 생명을 불어 넣기 위해 경기 전, 도중 및 후에 여러 가지 확인 및 프로세스가 수행됩니다. 다양한 이해 관계자들이 데이터 수집, 데이터 처리, 그래픽, 콘텐츠 제작 (TV 피드 편집 등) 및 라이브 해설에 관여합니다. 분데스리가 축구 경기장에는 각각 최대 20 대의 카메라가 장착되어있어 플레이어와 공 위치를 자동으로 추적 할 수 있습니다. 편집 팀은 추가 비디오 데이터를 처리하고 방송 할 이상적인 카메라 각도와 장면을 선택합니다. TV에 정확히 일치 사실을 표시 할시기에 대한 결정도 포함됩니다.

페널티 킥, 목표 샷과 같은 거의 모든 경기는 실시간으로 문서화되어 원격 검증을 위해 DFL 시스템으로 전송됩니다. 휴먼 어노 테이터는 이벤트를 추가 상황 별 정보로 분류하고 보완합니다. 예를 들어, 플레이어 및 팀 배정 및 촬영 유형 (예 : 차단 또는 보조)을 추가 할 수 있습니다.

결국 모든 원시 일치 데이터가 AWS의 Bundesliga Match Facts 시스템에 수집되어 xGoals 값을 계산 한 다음 방송용으로 전세계에 배포됩니다.

공식 Bundesliga 앱 및 웹 사이트의 경우 가능한 빨리 최종 사용자 장치에 Match Facts가 지속적으로 표시됩니다. 타사 디지털 플랫폼을 사용하는 DFL의 다른 외부 고객에게도 적용되며, 전 세계 축구 팬에게 최신 통찰력과 고급 통계를 제공합니다.

분데스리가 시합이 빈 경기장에서 진행되고 있기 때문에 실시간 콘텐츠 배포 및 팬 참여가 특히 중요합니다.

ML 여정 : 생산에 코드 도입

DFL의 리더십, 관리 및 개발자는 AWS 전문 서비스 팀 이 클라우드 도입 과정을 통해 ML이 향상된 시청자 경험을 가능하게합니다. AWS Data Science 컨설턴트의 임무는 효과적인 ML 사용을 통해 고객 비즈니스 성과를 가속화하는 것입니다. 고객 참여는 초기 평가부터 시작하여 비즈니스 및 기술 관점에서 원하는 결과와 타당성을 면밀히 검토합니다. AWS Professional Services 컨설턴트는 전문 기술과 업계 경험, POC (Proof of Concepts) 개발, MVP (Minimable Viable Product) 및 ML 솔루션을 프로덕션에 제공하는 고객의 기존 팀을 보완합니다. 동시에 지속적인 학습 및 지식 이전은 지속 가능하고 직접 귀속되는 비즈니스 가치를 창출합니다.

DFL의 자회사 인 Sportec Solutions에서 수행 한 사내 실험 및 프로토 타이핑 외에도 잘 확립 된 연구 커뮤니티는 이미 xGoals 계산의 성능과 정확성을 개선하기 위해 노력하고 있습니다. 이 도메인 지식을 올바른 기술 스택과 결합하고 모범 사례를 설정하면 운영 효율성, 보안, 안정성, 성능 효율성 및 비용 최적화를 보장하면서 규모에 관계없이 더 빠른 혁신 및 실행이 가능합니다.

과거의 축구 경기 데이터는 최첨단 ML 기반 xGoals 모델 훈련 접근법의 기초입니다. 이 데이터를 사용하여 ML 모델을 훈련시켜 경기장에서 주어진 조건에 따라 xGoals 결과를 유추 할 수 있습니다. 데이터 품질 평가 및 초기 실험을 위해서는 탐색 적 데이터 분석, 데이터 시각화, 데이터 변환 및 데이터 유효성 검사를 수행해야합니다. 예를 들어,이 작업을 수행 할 수 있습니다 Amazon SageMaker 노트북. 다음 단계는 ML 워크로드를 이동하는 것입니다 연구에서 개발까지. ML 모델을 프로덕션에 배포하려면 데이터 엔지니어링, 데이터 과학 및 소프트웨어 개발의 조합을 포함한 학제 간 엔지니어링 접근 방식이 필요합니다. 프로덕션 설정에는 오류 처리, 장애 조치 및 복구 계획이 필요합니다. 사무용 겉옷, ML 시스템 개발 및 운영 (MLOps)에는 코드 리팩토링, 리엔지니어링 및 최적화, 자동화, 기본 클라우드 인프라 설정, DevOps 및 보안 패턴 구현, 엔드 투 엔드 테스트, 모니터링 및 적절한 시스템 설계가 필요합니다. 목표는 항상 수동 개입을 최소화하고 유지 보수 필요성을 줄이기 위해 가능한 한 많은 시스템 구성 요소를 자동화하는 것이어야합니다.

다음 섹션에서는 xGoals를 프로덕션으로 가져 오는 경로를 간소화 할 때 AWS에서 제공하는 Bundesliga Match Facts의 기술 스택과 기본 고려 사항에 대해 자세히 살펴 봅니다.

Amazon SageMaker를 사용한 xGoals 모델 교육

기존 xGoals ML 모델은 이벤트 데이터만을 기반으로합니다. 이는 득점 득점 기회를 평가할 때 선수의 대략적인 위치와 목표까지의 거리 만 고려한다는 것을 의미합니다. 분데스리가의 경우 목표 달성시 이벤트는 25Hz 프레임 속도로 얻은 추가 고정밀 위치 데이터와 결합됩니다. 필요한 데이터 스트림 분석 파이프 라인 내에서 데이터 정리 및 데이터 사전 처리에 추가 오버 헤드가 발생합니다. 그러나보다 정확한 결과를 얻을 수 있다는 이점은 필요한 엔지니어링 노력과 도입 된 복잡성을 능가합니다. 지속적으로 추적되는 공과 선수 위치에 따라, 모델은 선수와 목표까지의 거리, 목표까지의 각도, 선수 속도, 라인 수비수와 같은 추가 기능의 배열을 결정할 수 있습니다 샷 및 골키퍼 범위.

xGoals의 경우 Amazon SageMaker를 사용했습니다. XGBoost 알고리즘 40,000 년부터 Bundesliga의 목표에서 2017 개가 넘는 역사적 샷에 대한 ML 모델 훈련 ). 그만큼 Amazon SageMaker Python SDK 내장 스케일링을 통해 프로그래밍 방식으로 교육을 쉽게 수행 할 수 있습니다. 또한 자동 배포에 필요한 리소스 배포 및 관리의 복잡성을 추상화합니다. XGBoost 하이퍼 파라미터 최적화. 더 빠른 실험을 위해 사용 가능한 데이터의 작은 하위 세트로 개발을 시작하고 전체 데이터 세트에 대해 훈련 된 더 복잡한 ML 모델로 점차 진화하고 최적화하는 것이 좋습니다.

xGoals 교육 작업은 다음과 같은 이진 분류 작업으로 구성됩니다. ROC 곡선 아래 영역 (AUC)는 목표를 달성했거나 달성하지 못한 목표의 샷에 대한 목표 메트릭스 및 고도의 불균형 훈련 및 검증 데이터 세트로 사용됩니다.

베이지안 검색 기반 하이퍼 파라미터 최적화 작업의 다양한 ML 모델 후보를 고려할 때 가장 실적이 좋은 것은 Amazon SageMaker 엔드 포인트. 리소스 요구 사항과 수명이 다르기 때문에 ML 모델 교육은 호스팅과 분리됩니다. 엔드 포인트는 다음과 같은 애플리케이션 내에서 호출 될 수 있습니다. AWS 람다 실시간 추론을위한 API 호출을 사용하여 Amazon SageMaker 노트북 내에서

그러나 Amazon SageMaker를 사용하여 ML 모델을 교육하는 것만으로는 충분하지 않습니다. 데이터 통합, 데이터 정리, 데이터 전처리, 기능 엔지니어링 및 ML 모델 교육 및 배포로 구성된 전체 클라우드 ML 파이프 라인을 처리하려면 다른 인프라 구성 요소가 필요합니다. 또한 다른 애플리케이션 별 클라우드 구성 요소를 통합해야합니다.

xGoals 아키텍처 : 서버리스 ML

애플리케이션 아키텍처를 설계하기 전에 지속적인 통합 및 지속적인 배포 / 배포 (CI / CD) 파이프 라인이 있습니다. 에 명시된 지침에 따라 AWS Well-Architected Framework 백서우리는 독립적 인 개발, 준비 및 생산 CI / CD 파이프 라인 단계를위한 다중 계정 설정 접근 방식을 따랐습니다. 우리는 이것을 코드로서의 인프라 (IaC) 접근 방식은 이러한 환경을 프로비저닝하고 각 코드 변경에 대해 예측 가능한 배치를 갖습니다. 이를 통해 팀은 환경을 분리하고 릴리스주기를 줄이며 코드의 테스트 가능성을 높일 수 있습니다. 개발자 도구를 설치 한 후 애플리케이션 아키텍처를 작성하기 시작했습니다. 다음 다이어그램은이 아키텍처를 보여줍니다.

데이터는 두 가지 방법으로 수집됩니다. AWS 파게이트 위치 및 이벤트 데이터 스트림을 수신하는 (컨테이너 용 서버리스 컴퓨팅 엔진)에 사용됩니다. 아마존 API 게이트웨이 팀 구성 및 플레이어 이름과 같은 추가 메타 데이터를 수신합니다. 이 수신 데이터는 Lambda 함수를 트리거합니다. 이 Lambda 기능은 유휴 리소스의 자동 프로비저닝 해제와 같은 다양한 단기간의 일회성 작업을 처리합니다. 데이터 전처리; 단순 추출, 변환 및로드 (ETL) 작업; 새로운 일치 데이터가 사용될 때마다 발생하는 여러 데이터 품질 테스트. 또한 Lambda를 사용하여 Amazon SageMaker 엔드 포인트를 호출하여 일련의 입력 기능이 제공된 xGoals 예측을 검색합니다.

일치 상태를 저장하기 위해 두 개의 데이터베이스를 사용합니다. 아마존 DynamoDB, 키-값 데이터베이스 및 아마존 문서 DB (MongoDB 호환), 문서 데이터베이스. 후자는 중첩 구조를 사용하여 JSON 형식으로 위치 및 이벤트 데이터를 쉽게 쿼리하고 색인화 할 수 있습니다. 이는 빠르고 반복적 인 개발을 위해 워크로드에 유연한 스키마가 필요한 경우에 특히 적합합니다. 공식 경기 데이터의 중앙 저장을 위해 아마존 단순 스토리지 서비스 (아마존 S3). Amazon S3는 모든 경기 일의 기록 데이터를 저장하며 xGoals 모델을 반복적으로 개선하는 데 사용됩니다. Amazon S3는 모델 성능, 모델 모니터링 및 보안 지표에 대한 메타 데이터도 저장합니다.

응용 프로그램의 성능을 모니터링하기 위해 AWS 증폭 웹 애플리케이션. 이를 통해 운영 팀과 비즈니스 이해 관계자는 시스템 상태 및 일치 사실 계산 상태 및 기본 클라우드 인프라를 사용자 친화적 인 대시 보드 형태로 개괄적으로 확인할 수 있습니다. 이러한 운영 통찰력은 현재 시스템의 지속적인 개선을 보장하기 위해 경기 후 회귀 분석을 캡처하고 통합하는 데 중요합니다. 이 대시 보드를 통해 원하는 비즈니스 성과 달성을 측정하고 평가하기위한 메트릭을 수집 할 수도 있습니다. 전체 시스템로드 및 성능, 엔드 투 엔드 대기 시간 및 기타 비 기능적 요구 사항과 같은 관련 KPI를 지속적으로 모니터링하면 비즈니스 및 기술 관점에서 현재 시스템을 전체적으로 볼 수 있습니다.

xGoals 아키텍처는 확장 성이 뛰어나고 사용하기 쉽도록 완전히 서버리스 방식으로 구축되었습니다. 완전 관리 형 서비스는 관리 서버 및 기타 기본 인프라 구성 요소의 미분화 작업을 제거합니다. 이 아키텍처를 통해 게임 종료시 수동 작업없이 리소스가 시작되고 리소스를 릴리스 할 때 요구 사항을 동적으로 지원할 수 있으므로 애플리케이션 비용과 운영 오버 헤드가 줄어 듭니다.

요약

Bundesliga와 AWS는 2020 년 200 월 AWS를 공식 기술 제공 업체로 명명 한 이후 XNUMX여 개국의 축구 팬과 브로드 캐스터에게 고급 분석 기능을 제공하기 위해 함께 여행을 시작했습니다. AWS가 제공하는 Bundesliga Match Facts는 청중이 의사 결정과 관련된 전략을 더 잘 이해하도록 도와줍니다. 축구 선수는 xGoals를 통해 경기장의 여러 조건에 따라 골 득점 확률을 정량적으로 평가할 수 있습니다. 다른 유스 케이스로는 개별 선수와 골키퍼의 성과 지표 형태의 득점 기회 집계, 경기의 스코어 라인이 경기장에서 일어난 일을 공정하게 반영했는지에 대한 객관적인 평가가 있습니다.

AWS Professional Services는 DFL 및 자회사 인 Sportec Solutions와 손 잡고 협력하여 디지털 변환, 비즈니스 성과 가속화 및 보장 지속적인 혁신. 다가오는 시즌 동안 DFL은 AWS의 새로운 Bundesliga Match Facts를 소개하여 팬의 참여를 유도하고 세계 최고 수준의 축구 시청 경험을 제공합니다.

“Bundesliga는 통계, 분석 및 기계 학습을 포함하여 AWS의이 고급 기술을 사용하여 데이터를 해석하고 심층적 인 통찰력을 제공하고 피치에 대한 의사 결정을보다 잘 이해할 수 있습니다. Bundesliga Match Facts를 사용하면 시청자가 각 경기의 주요 결정에 대한 심층적 인 통찰력을 얻을 수 있습니다.”

— Andreas Heyden, DFL 그룹의 디지털 혁신 담당 부사장


저자에 관하여

마르셀로 애 버레 AWS Professional Services 팀의 데이터 과학자이며 고객과 협력하여 AI / ML을 사용하여 비즈니스 성과를 가속화합니다. 그는 Bundesliga Match Facts xGoals의 수석 개발자였습니다. 그는 오랜 시간 여행을 즐기며 미니멀리스트 디자인과 건축에 대한 열렬한 팬입니다.

미르코 자네 츠케 DFL 그룹의 데이터 수집, 데이터 및 통계 시스템 및 축구 분석을 담당하는 DFL 자회사 인 Sportec Solutions GmbH의 IT 개발 책임자입니다. Mirko는 축구를 좋아하고 Bundesliga와 그의 홈 팀을 어린 소년 시절부터 따라 왔습니다. 여가 시간에는 가족과 친구들과 함께 바이에른 알프스에서 하이킹을갑니다.

리나 몬그 란드 AWS Professional Services의 선임 엔터프라이즈 서비스 관리자입니다. Lina는 미디어 및 엔터테인먼트 고객이 클라우드 전략과 접근 방식을 구축하고 전환 여정을 안내하는 데 중점을 둡니다. 그녀는 AI / ML과 같은 신기술과 특히 이러한 기술이 고객이 비즈니스 성과를 달성하는 데 어떻게 도움이 될 수 있는지에 대해 열정적입니다. 여가 시간에 Lina는 친구 및 가족과 함께 인근 알프스 (그녀는 뮌헨에 거주)에서 등산을 즐깁니다.

출처 : https://aws.amazon.com/blogs/machine-learning/the-tech-behind-the-bundesliga-match-facts-xgoals-how-machine-learning-is-driving-data-driven-insights- 축구 /

spot_img

최신 인텔리전스

spot_img