شعار زيفيرنت

داخل التكنولوجيا – حل البحث متعدد اللغات والدلالي

التاريخ:

Inside the Tech عبارة عن سلسلة من المدونات المصاحبة لموقعنا بودكاست محادثات التكنولوجيا. في الحلقة 19 من البودكاست عالميا، تحدث الرئيس التنفيذي لشركة Roblox David Baszucki مع المدير الأول للمنتج Zhen Fang حول استراتيجية Roblox الدولية والتحديات التقنية التي نحلها لضمان تجربة محلية لعشرات الملايين من الأشخاص حول العالم. في هذا الإصدار من Inside the Tech، تحدثنا مع مدير الهندسة رافالي كاندور لمعرفة المزيد حول أحد تلك التحديات التقنية، البحث متعدد اللغات والدلالي، وكيف يساعد عمل فريق النمو مستخدمي Roblox في جميع أنحاء العالم في البحث عن - والعثور عليها بسرعة - أي شيء يريدونه على منصتنا.

ما هو التحدي الفني الأكبر الذي يواجهه فريقك؟

حتى قبل عام تقريبًا، استخدم بحث Roblox نظامًا معجميًا لمطابقة النتائج مع عمليات بحث المستخدمين، مما يعني أنه يركز فقط على مطابقة النص. لكن سلوكيات البحث تتغير بسرعة ولم يعد هذا النهج كافيًا لتزويد المستخدمين بالمحتوى ذي الصلة. وفي الوقت نفسه، قد يستخدم بعض مستخدمي Roblox تهجئة غير صحيحة في استعلاماتهم. لذا، علينا أن نكون قادرين على اقتراح النتائج التي تتوافق مع ما يبحثون عنه، مما يعني فهم نواياهم.

مشكلة رئيسية أخرى في البحث هي نقص بيانات التدريب عبر اللغات. قبل البحث الدلالي، كانت خطوتنا الأولى هي الاستفادة من الترجمات الآلية داخل نظام Roblox. قمنا بفهرسة الترجمات ثم قمنا بمطابقة النص. لكن هذا لا يكفي لعرض المحتوى ذي الصلة للمستخدمين دائمًا. لذلك، قمنا بتبني تقنية ML أكثر حداثة تسمى نموذج الطالب والمعلم: يتعلم المعلم من أكبر مصدر لدينا للسياق لأي سيناريو محدد. 

اللغة الإنجليزية هي اللغة الأكثر استخدامًا في Roblox، ولهذا السبب نتعلم أكبر عدد ممكن من العلاقات الدلالية في اللغة الإنجليزية - نموذج المعلم - ثم نقوم بتقطيرها إلى نموذج الطالب من خلال توسيع ذلك ليشمل لغات أخرى. وهذا يساعدنا على حل هذه المشكلة على الرغم من عدم توفر الكثير من البيانات بلغات معينة. وقد أدى هذا إلى زيادة بنسبة 15% في عدد مرات التشغيل الناتجة عن البحث في اليابان. 

لقد عملنا مؤخرًا على تقديم دعم أفضل لاستعلامات الكتالوج مثل "đua xe (سباق)." لكن المستخدمين يرسلون في كثير من الأحيان استفسارات طويلة وحرة، مثل: "مرحبًا، أتذكر أنني كنت ألعب لعبة حيث كان هناك تنين وفتاة تتقاتلان معه. هل يمكنك مساعدتي في العثور على ذلك؟" ويمثل هذا المزيد من التحديات التقنية ونحن مستمرون في تحسين أنظمتنا على هذا المنوال.

ما هي بعض الأساليب المبتكرة لدمج المزيد من السياق والمزيد من البحث الدلالي؟

لقد قمنا ببناء نظام بحث مختلط يأخذ البحث المعجمي ويجمعه مع تقنيات ونماذج تعلم الآلة باستخدام البحث الدلالي وفهم غرض الاستعلام. نحن نعمل باستمرار على تطوير أنظمتنا لبناء فهم السياق والتعامل مع الاستعلامات المعقدة وإرجاع المحتوى ذي الصلة.

يكمن سحر البحث الدلالي في التضمينات، وهي عبارة عن تمثيلات غنية لمجموعة متنوعة من الإشارات التي نحصل عليها من جميع أنحاء Roblox. على سبيل المثال، نقوم بدمج إشارات مثل المعلومات السكانية للمستخدم، أو استعلام المستخدم، أو المدة التي يستغرقها البحث، أو ما هي جوانبه الفريدة. 

نحن ننظر أيضًا إلى إشارات المحتوى، مثل التجارب والعناصر الرمزية والمشاركة - كم مرة تم لعب هذه اللعبة أو كم عدد المستخدمين لديها، ومن كم عدد البلدان؟ هناك أيضًا أشياء مثل تحقيق الدخل والاحتفاظ، بالإضافة إلى البيانات الوصفية مثل عنوان التجربة أو وصفها أو منشئها. لقد وضعنا كل ذلك من خلال بنية قائمة على المحولات BERT ونستخدم متعدد الطبقات المستقبلات في النهاية لتوليد التضمينات، التي تصبح مصدر الحقيقة لدينا. 

ابتكار آخر هو نظام البحث عن التشابه الداخلي لدينا. عندما يقوم شخص ما بإجراء استعلام بحث، فإننا نقوم باسترداد التضمينات ذات الصلة الوثيقة، ونقوم بتصنيفها للتأكد من أنها ذات صلة بما يبحث عنه المستخدم. ومن ثم نعيد النتائج للمستخدمين.

ما هي بعض الأشياء الأساسية التي تعلمتها من القيام بهذا العمل الفني؟

تقدم كل لغة تحديًا فريدًا خاصًا بها. وخاصة فيما يتعلق بالبحث، نحتاج إلى فهم ما يبحث عنه المستخدمون في مختلف أنحاء العالم حتى نتمكن من عرض النتائج الأكثر صلة بهم. علينا أن نفهم عناصر اللغة المختلفة. على سبيل المثال، كانت المحولات المدربة مسبقًا ضرورية لفهم اللهجات اليابانية المتعددة.

ثانيًا، لقد تغيرت أنماط استعلام البحث قليلاً وعلينا أن نطور باستمرار مجموعتنا التكنولوجية لمواكبة ذلك. وفي الوقت نفسه، نحتاج إلى إعلام مستخدمينا بما هو ممكن على منصتنا، لأنهم قد لا يدركون ذلك. على سبيل المثال، يمكننا إخبار مستخدمينا أن البحث يمكن أن يدعم أشياء مثل الاستعلامات الحرة (مثل ألعاب السباق أو ألعاب الطعام الشائعة) وأنه يفهم ما يبحث عنه الأشخاص ويمكنه عرض النتائج المناسبة. 

ما هي قيمة Roblox التي يتوافق معها فريقك أكثر؟

إن اتخاذ وجهة نظر بعيدة المدى هو أمر أساسي لفريقنا وهو أحد الأسباب التي تجعلني أحب العمل في Roblox.

أحد الأمثلة من فريقي هو مجموعتنا التقنية، والتي تتكون من أنظمة البحث القائمة على ML وNLP - البحث الدلالي والإكمال التلقائي وتصحيح الإملاء باستخدام نماذج كبيرة مدربة مسبقًا.

لقد أنشأنا هذا مع وضع إمكانية إعادة الاستخدام في الاعتبار عبر أنواع مختلفة من عمليات البحث التي أجراها عشرات الملايين من المستخدمين النشطين يوميًا. وهذا يعني أنه يمكننا إدخال نوع مختلف من البيانات (على سبيل المثال، العناصر الرمزية بدلاً من التجارب)، ويجب أن تعمل مع الحد الأدنى من التغييرات. 

لقد قمنا بدمج البحث الدلالي عن التجارب، وقمنا بمشاركته مع قطاعات أخرى مثل Marketplace، وتمكنوا من القفز على البنية الحالية. إنها ليست ميزة التوصيل والتشغيل بشكل مثالي، ولكن مع بعض الضبط الدقيق، يمكننا تكييفها مع حالات الاستخدام المختلفة.

ما الذي يثير اهتمامك أكثر بشأن المكان الذي يتجه إليه Roblox وفريقك؟

البحث هو السطح الوحيد الذي يعبر فيه المستخدمون عن نواياهم الصريحة. وهذا يعني أنه من الضروري أن نفهم ما يريدون ونمنحهم النتائج الأكثر صلة. لذلك من المثير حقًا بالنسبة لي أن أعمل على فهم هذه النية وتثقيف مستخدمينا حول ما هو ممكن، وأحيانًا حتى قبل أن يدرك المستخدم ذلك. 

يمكن للمستخدم في أي بلد أن يطلب شيئًا ما، ويمكننا أن نمنحه ما يريده بالضبط وهو الأكثر صلةً به. وهذا يبني الثقة، وهو ما يؤدي بدوره إلى تحسين الاحتفاظ بالموظفين. من المثير بالنسبة لي أن أواجه التحدي المتمثل في تحسين البحث لبناء تلك الثقة ومساعدة Roblox على تحقيق هدفنا المتمثل في الحصول على مليار مستخدم.

بقعة_صورة

أحدث المعلومات الاستخباراتية

بقعة_صورة