شعار زيفيرنت

رحلة المساعد الافتراضي القائم على الذكاء الاصطناعي من PGA TOUR، من المفهوم إلى التطوير إلى النموذج الأولي | خدمات الويب الأمازون

التاريخ:

هذا منشور ضيف تمت كتابته بالاشتراك مع سكوت جوترمان من جولة PGA.

لقد أتاح الذكاء الاصطناعي التوليدي (الذكاء الاصطناعي التوليدي) إمكانيات جديدة لبناء أنظمة ذكية. أتاحت التحسينات الأخيرة في نماذج اللغات الكبيرة القائمة على الذكاء الاصطناعي (LLMs) استخدامها في مجموعة متنوعة من التطبيقات المحيطة باسترجاع المعلومات. وبالنظر إلى مصادر البيانات، قدمت LLM الأدوات التي من شأنها أن تسمح لنا ببناء برنامج دردشة للأسئلة والأجوبة في أسابيع، بدلاً من ما قد يستغرقه سنوات سابقة، ومن المحتمل أن يكون بأداء أسوأ. لقد قمنا بصياغة حل الاسترجاع المعزز (RAG) الذي من شأنه أن يسمح لـ PGA TOUR بإنشاء نموذج أولي لمنصة مشاركة المعجبين المستقبلية التي يمكن أن تجعل بياناتها في متناول المشجعين بطريقة تفاعلية بتنسيق محادثة.

يتطلب استخدام البيانات المنظمة للإجابة على الأسئلة طريقة لاستخراج البيانات ذات الصلة باستعلام المستخدم بشكل فعال. لقد قمنا بصياغة منهج تحويل النص إلى SQL حيث يتم تحويل استعلام اللغة الطبيعية للمستخدم إلى عبارة SQL باستخدام LLM. يتم تشغيل SQL بواسطة أمازون أثينا لإرجاع البيانات ذات الصلة. يتم تقديم هذه البيانات مرة أخرى إلى LLM، والذي يُطلب منه الإجابة على استفسار المستخدم في ضوء البيانات.

يتطلب استخدام البيانات النصية فهرسًا يمكن استخدامه للبحث وتوفير السياق ذي الصلة لـ LLM للإجابة على استعلام المستخدم. لتمكين استرجاع المعلومات بسرعة، نستخدم أمازون كندرا كمؤشر لهذه الوثائق. عندما يطرح المستخدمون أسئلة، يقوم مساعدنا الافتراضي بالبحث بسرعة عبر فهرس Amazon Kendra للعثور على المعلومات ذات الصلة. تستخدم Amazon Kendra معالجة اللغة الطبيعية (NLP) لفهم استعلامات المستخدم والعثور على المستندات الأكثر صلة. يتم بعد ذلك تقديم المعلومات ذات الصلة إلى LLM لتوليد الاستجابة النهائية. الحل النهائي لدينا هو مزيج من أساليب تحويل النص إلى SQL وtext-RAG.

في هذه التدوينة نسلط الضوء على كيفية مركز AWS للابتكار في مجال الذكاء الاصطناعي تعاونت مع الخدمات المهنية AWS و PGA TOUR لتطوير نموذج مساعد افتراضي باستخدام أمازون بيدروك يمكن أن يمكّن المشجعين من استخراج معلومات حول أي حدث أو لاعب أو ثقب أو تفاصيل مستوى التسديد بطريقة تفاعلية سلسة. Amazon Bedrock هي خدمة مُدارة بالكامل توفر مجموعة مختارة من نماذج الأساس عالية الأداء (FMs) من شركات الذكاء الاصطناعي الرائدة مثل AI21 Labs وAnthropic وCohere وMeta وStability AI وAmazon عبر واجهة برمجة تطبيقات واحدة، إلى جانب مجموعة واسعة من القدرات التي تحتاجها لإنشاء تطبيقات ذكاء اصطناعي منتجة تتمتع بالأمان والخصوصية والذكاء الاصطناعي المسؤول.

التطوير: تجهيز البيانات

كما هو الحال مع أي مشروع يعتمد على البيانات، لن يكون الأداء جيدًا إلا بقدر جودة البيانات. لقد قمنا بمعالجة البيانات لتمكين LLM من الاستعلام عن البيانات ذات الصلة واسترجاعها بشكل فعال.

بالنسبة لبيانات المنافسة المجدولة، ركزنا على مجموعة فرعية من البيانات ذات الصلة بأكبر عدد من استعلامات المستخدم وقمنا بتسمية الأعمدة بشكل حدسي، بحيث يكون من الأسهل على طلاب ماجستير إدارة الأعمال فهمها. لقد أنشأنا أيضًا بعض الأعمدة المساعدة لمساعدة ماجستير القانون في فهم المفاهيم التي قد يواجه صعوبة في التعامل معها. على سبيل المثال، إذا أطلق لاعب غولف طلقة واحدة أقل من المعدل (مثل جعلها في الحفرة في 3 طلقات على المعدل 4 أو في 4 طلقات على المعدل 5)، يُطلق على ذلك عادةً اسم "الضربة" طائر صغير. إذا سأل المستخدم، "كم عدد الطيور التي صنعها اللاعب X في العام الماضي؟"، فإن مجرد الحصول على النتيجة والتعادل في الجدول ليس كافيًا. ونتيجة لذلك، أضفنا أعمدة للإشارة إلى مصطلحات الجولف الشائعة، مثل الشبح والطائر والنسر. بالإضافة إلى ذلك، قمنا بربط بيانات المسابقة بمجموعة فيديو منفصلة، ​​من خلال ضم عمود لـ video_id، مما يسمح لتطبيقنا بسحب الفيديو المرتبط بلقطة معينة في بيانات المسابقة. كما قمنا بتمكين ضم البيانات النصية إلى البيانات الجدولية، على سبيل المثال إضافة السيرة الذاتية لكل لاعب كعمود نصي. توضح الأشكال التالية الإجراء خطوة بخطوة لكيفية معالجة الاستعلام لمسار تحويل النص إلى SQL. تشير الأرقام إلى سلسلة الخطوات للإجابة على الاستعلام.

في الشكل التالي نعرض خط أنابيبنا الشامل. نحن نستخدم AWS لامدا باعتبارها وظيفة التنسيق لدينا المسؤولة عن التفاعل مع مصادر البيانات المختلفة، وLLMs وتصحيح الأخطاء بناءً على استعلام المستخدم. الخطوات من 1 إلى 8 مشابهة لما هو موضح في الشكل التالي. هناك تغييرات طفيفة للبيانات غير المنظمة، والتي نناقشها بعد ذلك.

تتطلب البيانات النصية خطوات معالجة فريدة تعمل على تقسيم (أو تقسيم) المستندات الطويلة إلى أجزاء قابلة للهضم بواسطة LLM، مع الحفاظ على تماسك الموضوع. لقد جربنا العديد من الأساليب واستقرنا على نظام تقسيم على مستوى الصفحة يتماشى بشكل جيد مع تنسيق أدلة الوسائط. استخدمنا Amazon Kendra، وهي خدمة مُدارة تهتم بفهرسة المستندات، دون الحاجة إلى تحديد مواصفات التضمينات، مع توفير واجهة برمجة تطبيقات سهلة للاسترجاع. ويوضح الشكل التالي هذه البنية.

يسمح خط الأنابيب الموحد والقابل للتطوير الذي قمنا بتطويره لـ PGA TOUR بالتوسع إلى تاريخها الكامل من البيانات، والتي يعود بعضها إلى القرن التاسع عشر. فهو يمكّن التطبيقات المستقبلية التي يمكن أن تظهر مباشرة في سياق الدورة التدريبية من إنشاء تجارب غنية في الوقت الفعلي.

التطوير: تقييم LLMs وتطوير تطبيقات الذكاء الاصطناعي التوليدية

لقد قمنا باختبار وتقييم LLMs من الطرف الأول والثالث المتوفرة في Amazon Bedrock لاختيار النموذج الأكثر ملاءمة لخط الأنابيب وحالة الاستخدام لدينا. لقد اخترنا Anthropic's Claude v2 وClaude Instant على Amazon Bedrock. بالنسبة لخط البيانات النهائي المنظم وغير المنظم، نلاحظ أن Anthropic's Claude 2 على Amazon Bedrock قد حقق نتائج إجمالية أفضل لخط البيانات النهائي الخاص بنا.

تعد المطالبة جانبًا مهمًا في جعل LLM يقوم بإخراج النص حسب الرغبة. لقد أمضينا وقتًا طويلاً في تجربة مطالبات مختلفة لكل مهمة من المهام. على سبيل المثال، بالنسبة لخط أنابيب تحويل النص إلى SQL، كان لدينا العديد من المطالبات الاحتياطية، مع زيادة الخصوصية ومخططات الجداول المبسطة تدريجيًا. إذا كان استعلام SQL غير صالح ونتج عنه خطأ من Athena، فقد قمنا بتطوير مطالبة لتصحيح الأخطاء من شأنها تمرير الخطأ وSQL غير الصحيحة إلى LLM ومطالبتها بإصلاحه. تطلب المطالبة النهائية في مسار تحويل النص إلى SQL من LLM أخذ مخرجات Athena، والتي يمكن توفيرها بتنسيق Markdown أو CSV، وتقديم إجابة للمستخدم. بالنسبة للنص غير المنظم، قمنا بتطوير مطالبات عامة لاستخدام السياق المسترد من Amazon Kendra للإجابة على سؤال المستخدم. تضمنت المطالبة تعليمات لاستخدام المعلومات المستردة من Amazon Kendra فقط وعدم الاعتماد على البيانات من التدريب المسبق لـ LLM.

غالبًا ما يكون زمن الوصول مصدر قلق لتطبيقات الذكاء الاصطناعي التوليدية، وهذا هو الحال هنا أيضًا. إنه مصدر قلق بشكل خاص لتحويل النص إلى SQL، والذي يتطلب استدعاء LLM لإنشاء SQL أولي، متبوعًا باستدعاء LLM لإنشاء الاستجابة. إذا كنا نستخدم LLM كبيرًا، مثل Anthropic's Claude V2، فإن هذا يضاعف بشكل فعال زمن الوصول لاستدعاء LLM واحد فقط. لقد جربنا العديد من تكوينات LLMs الكبيرة والصغيرة لتقييم وقت التشغيل بالإضافة إلى صحتها. يعرض الجدول التالي مثالاً لسؤال واحد موضح أدناه يوضح زمن الاستجابة، بالإضافة إلى الاستجابات التي تم إنشاؤها باستخدام Anthropic's Claude V2 وClaude Instant على Amazon Bedrock.

النموذج

في تطبيقنا، استخدمنا وظيفة Lambda لتنسيق الاختيارات السريعة والتواصل بين Amazon Athena وAmazon Kendra وAmazon Bedrock. يتميز المساعد الافتراضي بواجهة محادثة، تم إنشاؤها باستخدام React ونظام تصميم Cloudscape، والتي تستخدم النصوص ومقاطع الفيديو للتفاعل مع المستخدمين.

يمكن لمساعدنا الافتراضي الإجابة على مجموعة واسعة من الأسئلة حول أحداث PGA TOUR واللاعبين والإحصائيات والتاريخ والمزيد. على سبيل المثال، عند سؤاله عن أطول رحلات توني فيناو في بطولة Shriners Children's Open (أحد الأحداث المميزة لجولة PGA)، يمكن للمساعد الاستعلام عن البيانات المنظمة لسحب بيانات مستوى اللقطة الخاصة به. ويمكنه استخراج المسافة الدقيقة بالياردات والرقم الدائري والحفرة التي حقق خلالها هذا السجل باستخدام خط أنابيب تحويل النص إلى SQL. ثم يقوم المساعد بتفسير هذه البيانات الرقمية لتوليد الاستجابة النهائية. يحتوي الجدول التالي على بعض نماذج الإجابات.

سؤال استجابة
ما هي أطول مسافة قطعها توني فيناو في بطولة Shriners Children's المفتوحة؟ أطول مسافة قطعها توني فيناو في بطولة Shriners Childrens Open كانت 382 ياردة، والتي ضربها خلال الجولة الأولى في الحفرة رقم 4 في عام 2018.
ما هي أطول مسافة قطعها كولين موريكاوا في بطولة Shriners Children's المفتوحة؟ كانت أطول مسافة قيادة لـ Collin Morikawa في Shriners Childrens Open هي 334 ياردة. حدث هذا في عام 2019 خلال الجولة الأولى في الحفرة رقم 15.
هل حقق أي شخص ضربة ساحقة في بطولة شراينرز للأطفال المفتوحة لعام 2022؟ نعم، قام آدم هادوين بعمل ثقب في الحفرة 14 خلال الجولة الثالثة من بطولة شراينرز المفتوحة للأطفال لعام 3

يسلط الفيديو التوضيحي التالي الضوء على بعض الأمثلة للتفاعل مع المساعد الافتراضي.

في الاختبار الأولي، أظهر مساعدنا الافتراضي PGA TOUR وعدًا كبيرًا في تحسين تجارب المعجبين. من خلال مزج تقنيات الذكاء الاصطناعي مثل تحويل النص إلى SQL والبحث الدلالي وتوليد اللغة الطبيعية، يقدم المساعد استجابات غنية بالمعلومات وجذابة. يتم تمكين المعجبين من الوصول بسهولة إلى البيانات والروايات التي كان من الصعب العثور عليها في السابق.

ماذا يحمل المستقبل؟

ومع استمرارنا في التطوير، سنقوم بتوسيع نطاق الأسئلة التي يمكن لمساعدنا الافتراضي التعامل معها. سيتطلب ذلك اختبارات مكثفة، من خلال التعاون بين AWS وPGA TOUR. وبمرور الوقت، نهدف إلى تطوير المساعد إلى تجربة مخصصة متعددة القنوات يمكن الوصول إليها عبر واجهات الويب والهاتف المحمول والصوت.

يتيح إنشاء مساعد الذكاء الاصطناعي القائم على السحابة لـ PGA TOUR تقديم مصدر بياناتها الضخم إلى العديد من أصحاب المصلحة الداخليين والخارجيين. مع تطور مشهد الذكاء الاصطناعي المولد للرياضة، فإنه يتيح إنشاء محتوى جديد. على سبيل المثال، يمكنك استخدام الذكاء الاصطناعي والتعلم الآلي (ML) لعرض المحتوى الذي يرغب المشجعون في رؤيته أثناء مشاهدتهم لحدث ما، أو عندما تبحث فرق الإنتاج عن لقطات من دورات سابقة تتطابق مع حدث حالي. على سبيل المثال، إذا كان Max Homa يستعد لأخذ فرصته الأخيرة في بطولة PGA TOUR من مكان على بعد 20 قدمًا من الدبوس، فيمكن لجولة PGA استخدام الذكاء الاصطناعي والتعلم الآلي لتحديد وتقديم مقاطع له، مع تعليق تم إنشاؤه بواسطة الذكاء الاصطناعي. محاولة لقطة مماثلة خمس مرات سابقًا. يتيح هذا النوع من الوصول والبيانات لفريق الإنتاج إضافة قيمة إلى البث على الفور أو السماح للمعجب بتخصيص نوع البيانات التي يريد رؤيتها.

"إن PGA TOUR هي الشركة الرائدة في مجال استخدام التكنولوجيا المتطورة لتحسين تجربة المعجبين. الذكاء الاصطناعي هو في طليعة مجموعتنا التكنولوجية، حيث يمكّننا من إنشاء بيئة أكثر جاذبية وتفاعلية للجماهير. هذه هي بداية رحلتنا في مجال الذكاء الاصطناعي التوليدي بالتعاون مع مركز AWS Geneative AI Innovation Center للحصول على تجربة تحويلية شاملة للعملاء. نحن نعمل على الاستفادة من Amazon Bedrock وبيانات الملكية الخاصة بنا لإنشاء تجربة تفاعلية لمحبي PGA TOUR للعثور على معلومات تهم حدثًا أو لاعبًا أو إحصائيات أو أي محتوى آخر بطريقة تفاعلية.
– سكوت جوترمان، نائب الرئيس الأول للبث والخصائص الرقمية في PGA TOUR.

وفي الختام

يوضح المشروع الذي ناقشناه في هذا المنشور كيف يمكن دمج مصادر البيانات المنظمة وغير المنظمة باستخدام الذكاء الاصطناعي لإنشاء مساعدين افتراضيين من الجيل التالي. بالنسبة للمؤسسات الرياضية، تتيح هذه التقنية مشاركة أكثر غامرة للمشجعين وتطلق العنان للكفاءات الداخلية. يساعد ذكاء البيانات الذي نعرضه أصحاب المصلحة في PGA TOUR مثل اللاعبين والمدربين والمسؤولين والشركاء ووسائل الإعلام على اتخاذ قرارات مستنيرة بشكل أسرع. وبعيدًا عن الرياضة، يمكن تكرار منهجيتنا في أي صناعة. تنطبق نفس المبادئ على مساعدي البناء الذين يقومون بإشراك العملاء والموظفين والطلاب والمرضى والمستخدمين النهائيين الآخرين. من خلال التصميم والاختبار المدروسين، يمكن لأي مؤسسة تقريبًا الاستفادة من نظام الذكاء الاصطناعي الذي يضع قواعد البيانات المنظمة والمستندات والصور ومقاطع الفيديو والمحتويات الأخرى في سياقها.

إذا كنت مهتمًا بتنفيذ وظائف مماثلة، ففكر في استخدام وكلاء شركة أمازون بيدروك و قواعد المعرفة لأمازون بيدروك كحل بديل مُدار بالكامل بواسطة AWS. يمكن لهذا النهج أن يحقق بشكل أكبر في توفير الأتمتة الذكية وقدرات البحث عن البيانات من خلال وكلاء قابلين للتخصيص. يمكن لهذه العوامل أن تحول تفاعلات تطبيقات المستخدم لتصبح أكثر طبيعية وكفاءة وفعالية.


عن المؤلفين

سكوت جوترمان هو نائب الرئيس الأول للعمليات الرقمية لجولة PGA. وهو مسؤول عن العمليات الرقمية الشاملة لـ TOUR، وتطوير المنتجات، ويقود استراتيجية GenAI الخاصة بهم.

احسن علي هو عالم تطبيقي في مركز Amazon Geneative AI Innovation Center، حيث يعمل مع عملاء من مجالات مختلفة لحل مشكلاتهم العاجلة والمكلفة باستخدام Geneative AI.

طاهين سيد هو عالم تطبيقي في مركز Amazon Geneative AI Innovation Center، حيث يعمل مع العملاء للمساعدة في تحقيق نتائج الأعمال باستخدام حلول الذكاء الاصطناعي التوليدية. خارج العمل، يستمتع بتجربة الأطعمة الجديدة والسفر وتعليم التايكوندو.

جريس لانج هو مهندس مشارك للبيانات وتعلم الآلة في خدمات AWS الاحترافية. انطلاقًا من شغفها بالتغلب على التحديات الصعبة، تساعد Grace العملاء على تحقيق أهدافهم من خلال تطوير حلول مدعومة بالتعلم الآلي.

جاي لي هو مدير مشاركة أول في قطاع الرصد والتقييم في ProServe. إنها تقود وتقدم التعاقدات المعقدة، وتعرض مجموعات مهارات قوية في حل المشكلات، وتدير توقعات أصحاب المصلحة، وتنظم العروض التقديمية على المستوى التنفيذي. إنها تستمتع بالعمل في المشاريع التي تركز على الرياضة والذكاء الاصطناعي التوليدي وتجربة العملاء.

كارن شاهار هو مستشار أمني مع فريق التسليم المشترك في AWS. إنه متحمس للتكنولوجيا ويستمتع بالعمل مع العملاء لحل تحدياتهم الأمنية وتحسين وضعهم الأمني ​​في السحابة.

مايك أمجدي هو مهندس البيانات وتعلم الآلة لدى AWS ProServe ويركز على تمكين العملاء من تحقيق أقصى قدر من القيمة من البيانات. وهو متخصص في تصميم وبناء وتحسين خطوط أنابيب البيانات باتباع مبادئ مصممة جيدًا. مايك متحمس لاستخدام التكنولوجيا لحل المشكلات وهو ملتزم بتقديم أفضل النتائج لعملائنا.

فروشالي ساوانت هو مهندس الواجهة الأمامية مع Proserve. إنها تتمتع بمهارة عالية في إنشاء مواقع الويب سريعة الاستجابة. تحب العمل مع العملاء وفهم متطلباتهم وتزويدهم بحلول UI/UX قابلة للتطوير وسهلة الاستخدام.

نيلام باتل هو مدير حلول العملاء في AWS، ويقود مبادرات الذكاء الاصطناعي التوليدي الرئيسية وتحديث السحابة. تعمل Neelam مع المديرين التنفيذيين الرئيسيين وأصحاب التكنولوجيا لمواجهة تحديات التحول السحابي ومساعدة العملاء على تحقيق أقصى قدر من فوائد اعتماد السحابة. حصلت على درجة الماجستير في إدارة الأعمال من كلية وارويك للأعمال بالمملكة المتحدة والبكالوريوس في هندسة الكمبيوتر بالهند.

الدكتور مورالي باكثا هو مهندس حلول الجولف العالمي في AWS، ويقود المبادرات المحورية التي تتضمن الذكاء الاصطناعي التوليدي وتحليلات البيانات والتقنيات السحابية المتطورة. تعمل مورالي مع المديرين التنفيذيين الرئيسيين وأصحاب التكنولوجيا لفهم تحديات أعمال العملاء وتصميم الحلول لمواجهة تلك التحديات. حصل على ماجستير إدارة الأعمال في المالية من جامعة UConn والدكتوراه من جامعة ولاية آيوا.

مهدي نور هو مدير العلوم التطبيقية في مركز الابتكار في الذكاء الاصطناعي. بفضل شغفه بالربط بين التكنولوجيا والابتكار، فهو يساعد عملاء AWS في إطلاق العنان لإمكانات الذكاء الاصطناعي التوليدي، وتحويل التحديات المحتملة إلى فرص للتجريب السريع والابتكار من خلال التركيز على الاستخدامات القابلة للتطوير والقابلة للقياس والمؤثرة لتقنيات الذكاء الاصطناعي المتقدمة، وتبسيط المسار. إلى الإنتاج.

بقعة_صورة

أحدث المعلومات الاستخباراتية

بقعة_صورة