شعار زيفيرنت

كسر حواجز اللغة باستخدام نموذج ترجمة متعدد اللغات – مدونة Roblox

التاريخ:

تخيل أنك اكتشفت أن صديقك الجديد في Roblox، وهو الشخص الذي كنت تدردش معه وتمزح معه في تجربة جديدة، موجود بالفعل في كوريا - وكان يكتب باللغة الكورية طوال الوقت، بينما كنت تكتب باللغة الإنجليزية، دون أي من الأمرين. أنت تلاحظ. بفضل ترجماتنا الجديدة للدردشة بالذكاء الاصطناعي في الوقت الفعلي، جعلنا من الممكن على Roblox شيئًا غير ممكن حتى في العالم المادي - تمكين الأشخاص الذين يتحدثون لغات مختلفة من التواصل بسلاسة مع بعضهم البعض في تجاربنا ثلاثية الأبعاد الغامرة. وهذا ممكن بفضل نموذجنا المخصص متعدد اللغات، والذي يتيح الآن الترجمة المباشرة بين أي مجموعة من اللغات الـ 3 التي ندعمها حاليًا (هذه اللغات الـ 15، وكذلك الإنجليزية). 

في أي تجربة مكنت لدينا دردشة نصية في الخبرة الخدمة، يمكن الآن فهم الأشخاص من مختلف البلدان من قبل الأشخاص الذين لا يتحدثون لغتهم. ستعرض نافذة الدردشة تلقائيًا اللغة الكورية مترجمة إلى الإنجليزية، أو التركية مترجمة إلى الألمانية، والعكس، بحيث يرى كل شخص المحادثة بلغته. يتم عرض هذه الترجمات في الوقت الفعلي، مع زمن وصول يبلغ حوالي 100 مللي ثانية، وبالتالي فإن الترجمة التي تحدث خلف الكواليس تكون غير مرئية تقريبًا. يؤدي استخدام الذكاء الاصطناعي لأتمتة الترجمات في الوقت الفعلي في الدردشة النصية إلى إزالة حواجز اللغة وجمع المزيد من الأشخاص معًا، بغض النظر عن المكان الذي يعيشون فيه في العالم. 

بناء نموذج ترجمة موحد

ترجمة الذكاء الاصطناعي ليست جديدة، حيث تتم بالفعل ترجمة غالبية المحتوى الناتج عن تجربتنا تلقائيًا. أردنا أن نتجاوز مجرد ترجمة المحتوى الثابت في التجارب. أردنا ترجمة التفاعلات تلقائيًا، وأردنا أن نفعل ذلك لجميع اللغات الـ 16 التي ندعمها على النظام الأساسي. كان هذا هدفًا جريئًا لسببين: أولاً، لم نكن نترجم من لغة أساسية واحدة (أي الإنجليزية) إلى أخرى فحسب، بل أردنا نظامًا قادرًا على الترجمة بين أي مجموعة من اللغات الـ 16 التي ندعمها. ثانيا، كان لا بد من ذلك بسرعة. سريع بما يكفي لدعم محادثات الدردشة الحقيقية، وهو ما يعني بالنسبة لنا خفض زمن الوصول إلى حوالي 100 مللي ثانية.

تعد Roblox موطنًا لأكثر من 70 مليون مستخدم نشط يوميًا في جميع أنحاء العالم ويتزايد عددهم. يتواصل الأشخاص ويبدعون على منصتنا - كل منهم بلغته الأم - على مدار 24 ساعة يوميًا. من الواضح أن الترجمة اليدوية لكل محادثة تجري عبر أكثر من 15 مليون تجربة نشطة، كل ذلك في الوقت الفعلي، غير ممكنة. إن توسيع نطاق هذه الترجمات الحية إلى ملايين الأشخاص، الذين يجرون جميعًا محادثات مختلفة في تجارب مختلفة في وقت واحد، يتطلب الحصول على ماجستير في القانون بسرعة ودقة هائلتين. نحن بحاجة إلى نموذج مدرك للسياق يتعرف على لغة Roblox الخاصة، بما في ذلك العامية والاختصارات (مثل obby أو afk أو lol). علاوة على كل ذلك، يحتاج نموذجنا إلى دعم أي مجموعة من اللغات الـ 16 التي يدعمها Roblox حاليًا. 

ولتحقيق ذلك، كان بإمكاننا بناء نموذج فريد لكل زوج لغوي (على سبيل المثال، اليابانية والإسبانية)، لكن ذلك كان يتطلب 16×16، أو 256 نموذجًا مختلفًا. بدلاً من ذلك، قمنا ببناء LLM ترجمة موحدة قائمة على المحولات للتعامل مع جميع أزواج اللغات في نموذج واحد. وهذا يشبه وجود تطبيقات ترجمة متعددة، كل منها متخصص في مجموعة من اللغات المتشابهة، وكلها متاحة بواجهة واحدة. بالنظر إلى الجملة المصدر واللغة الهدف، يمكننا تفعيل "الخبير" ذي الصلة لإنشاء الترجمات. 

تسمح هذه البنية باستخدام الموارد بشكل أفضل، نظرًا لأن كل خبير لديه تخصص مختلف، مما يؤدي إلى تدريب واستدلال أكثر كفاءة - دون التضحية بجودة الترجمة.

رسم توضيحي لعملية الاستدلال. يتم تمرير رسائل المصدر، إلى جانب اللغة المصدر واللغات المستهدفة من خلال RCC. قبل الوصول إلى النهاية الخلفية، نقوم أولاً بفحص ذاكرة التخزين المؤقت لمعرفة ما إذا كان لدينا بالفعل ترجمات لهذا الطلب. إذا لم يكن الأمر كذلك، فسيتم تمرير الطلب إلى النهاية الخلفية وإلى الخادم النموذجي باستخدام الدفعات الديناميكية. لقد أضفنا طبقة ذاكرة تخزين مؤقت مدمجة بين أجهزة التشفير وأجهزة فك التشفير لتحسين الكفاءة بشكل أكبر عند الترجمة إلى لغات مستهدفة متعددة.

تجعل هذه البنية تدريب نموذجنا وصيانته أكثر كفاءة لعدة أسباب. أولاً، نموذجنا قادر على الاستفادة من أوجه التشابه اللغوية بين اللغات. عندما يتم تدريب جميع اللغات معًا، تستفيد اللغات المتشابهة، مثل الإسبانية والبرتغالية، من مدخلات بعضها البعض أثناء التدريب، مما يساعد على تحسين جودة الترجمة لكلا اللغتين. يمكننا أيضًا اختبار ودمج الأبحاث الجديدة والتقدمات في LLMs في نظامنا بسهولة أكبر بكثير عند إصدارها، للاستفادة من أحدث وأكبر التقنيات المتاحة. نرى فائدة أخرى لهذا النموذج الموحد في الحالات التي لا يتم فيها تعيين لغة المصدر أو يتم تعيينها بشكل غير صحيح، حيث يكون النموذج دقيقًا بدرجة كافية بحيث يكون قادرًا على اكتشاف لغة المصدر الصحيحة وترجمتها إلى اللغة الهدف. في الواقع، حتى لو كان الإدخال يحتوي على مزيج من اللغات، فإن النظام لا يزال قادرًا على اكتشاف اللغة الهدف وترجمتها. في هذه الحالات، قد لا تكون الدقة عالية تمامًا، لكن الرسالة النهائية ستكون مفهومة إلى حد معقول.

لتدريب هذا النموذج الموحد، بدأنا بالتدريب المسبق على البيانات مفتوحة المصدر المتاحة، بالإضافة إلى بيانات الترجمة المكتسبة من خلال خبرتنا، ونتائج ترجمة الدردشة التي تم تصنيفها بواسطة الإنسان، وجمل وعبارات الدردشة الشائعة. لقد قمنا أيضًا ببناء مقياس ونموذج تقييم الترجمة الخاص بنا لقياس جودة الترجمة. تقارن معظم مقاييس جودة الترجمة الجاهزة نتيجة ترجمة الذكاء الاصطناعي ببعض الحقائق الأساسية أو الترجمة المرجعية وتركز في المقام الأول على سهولة فهم الترجمة. أردنا تقييم جودة الترجمة - بدون ترجمة حقيقية. 

نحن ننظر إلى هذا من جوانب متعددة، بما في ذلك الدقة (سواء كان هناك أي إضافات أو حذف أو ترجمة خاطئة)، والطلاقة (علامات الترقيم والتهجئة والنحو)، والمراجع غير الصحيحة (التناقضات مع بقية النص). نقوم بتصنيف هذه الأخطاء إلى مستويات خطورة: هل هو خطأ فادح أم كبير أم بسيط؟ من أجل تقييم الجودة، قمنا ببناء نموذج تعلم الآلة وقمنا بتدريبه على أنواع الأخطاء البشرية ودرجاتها. قمنا بعد ذلك بضبط نموذج لغة متعدد اللغات للتنبؤ بالأخطاء والأنواع على مستوى الكلمة وحساب النتيجة باستخدام معاييرنا متعددة الأبعاد. وهذا يمنحنا فهمًا شاملاً لجودة الأخطاء التي تحدث وأنواعها. وبهذه الطريقة يمكننا تقدير جودة الترجمة واكتشاف الأخطاء باستخدام النص المصدر والترجمات الآلية، دون الحاجة إلى ترجمة حقيقية. باستخدام نتائج مقياس الجودة هذا، يمكننا تحسين جودة نموذج الترجمة لدينا. 

باستخدام النص المصدر ونتيجة الترجمة الآلية، يمكننا تقدير جودة الترجمة الآلية دون ترجمة مرجعية، وذلك باستخدام نموذج تقدير جودة الترجمة الداخلي لدينا. يقوم هذا النموذج بتقدير الجودة من جوانب مختلفة ويصنف الأخطاء إلى أخطاء فادحة وكبيرة وثانوية.

تمثل أزواج الترجمة الأقل شيوعًا (على سبيل المثال، من الفرنسية إلى التايلاندية) تحديًا بسبب نقص البيانات عالية الجودة. لمعالجة هذه الفجوة، قمنا بتطبيق الترجمة العكسية، حيث تتم ترجمة المحتوى مرة أخرى إلى اللغة الأصلية، ثم مقارنته بالنص المصدر للتأكد من دقته. أثناء عملية التدريب، استخدمنا الترجمة العكسية التكرارية، حيث نستخدم مزيجًا استراتيجيًا من هذه البيانات المترجمة مرة أخرى والبيانات الخاضعة للإشراف (المسمى) لزيادة كمية بيانات الترجمة للنموذج للتعلم عليها. 

رسم توضيحي لخط أنابيب التدريب النموذجي. يتم استخدام كل من البيانات المتوازية وبيانات الترجمة الخلفية أثناء التدريب النموذجي. بعد تدريب نموذج المعلم، نقوم بتطبيق التقطير وتقنيات تحسين الخدمة الأخرى لتقليل حجم النموذج وتحسين كفاءة التقديم.

ولمساعدة النموذج على فهم اللغة العامية الحديثة، طلبنا من المقيمين البشريين ترجمة المصطلحات الشائعة والشائعة لكل لغة، وقمنا بإدراج تلك الترجمات في بيانات التدريب لدينا. سنستمر في تكرار هذه العملية بانتظام لإبقاء النظام محدثًا بأحدث اللغات العامية. 

يحتوي نموذج ترجمة الدردشة الناتج على ما يقرب من مليار معلمة. يعد تشغيل الترجمة من خلال نموذج بهذا الحجم أمرًا مستهلكًا للموارد بشكل كبير بحيث يمكن تقديمه على نطاق واسع وسيستغرق وقتًا طويلاً جدًا لإجراء محادثة في الوقت الفعلي، حيث يعد زمن الوصول المنخفض أمرًا بالغ الأهمية لدعم أكثر من 1 محادثة في الثانية. لذلك استخدمنا نموذج الترجمة الكبير هذا في نهج الطالب والمعلم لبناء نموذج أصغر حجمًا وأخف وزنًا. لقد طبقنا التقطير والتكميم وتجميع النماذج وتحسينات التقديم الأخرى لتقليل حجم النموذج إلى أقل من 5,000 مليون معلمة وتحسين كفاءة التقديم. بالإضافة إلى ذلك، قمنا بتعديل واجهة برمجة التطبيقات الخاصة بالدردشة النصية أثناء التجربة لإرسال كل من الرسائل الأصلية والمترجمة إلى جهاز الشخص. يتيح ذلك للمستلم رؤية الرسالة بلغته الأصلية أو التبديل بسرعة لرؤية رسالة المرسل الأصلية غير المترجمة.

بمجرد أن أصبحت شهادة LLM النهائية جاهزة، قمنا بتنفيذ واجهة خلفية للاتصال بالخوادم النموذجية. هذه النهاية الخلفية هي حيث نطبق منطقًا إضافيًا لترجمة الدردشة وندمج النظام مع أنظمة الثقة والأمان المعتادة لدينا. ويضمن ذلك حصول النص المترجم على نفس مستوى التدقيق مثل النصوص الأخرى، وذلك لاكتشاف الكلمات أو العبارات التي تنتهك سياساتنا وحظرها. السلامة والكياسة هي في طليعة كل ما نقوم به في Roblox، لذلك كان هذا جزءًا مهمًا جدًا من اللغز. 

التحسين المستمر للدقة

أثناء الاختبار، رأينا أن نظام الترجمة الجديد هذا يؤدي إلى مشاركة أقوى وجودة جلسة للأشخاص على منصتنا. استنادًا إلى المقياس الخاص بنا، يتفوق نموذجنا على واجهات برمجة التطبيقات للترجمة التجارية على محتوى Roblox، مما يشير إلى أننا نجحنا في تحسين كيفية تواصل الأشخاص على Roblox. يسعدنا أن نرى كيف يؤدي ذلك إلى تحسين تجربة الأشخاص على النظام الأساسي، مما يتيح لهم ممارسة الألعاب أو التسوق أو التعاون أو مجرد التواصل مع الأصدقاء الذين يتحدثون لغة مختلفة.

إن قدرة الناس على إجراء محادثات سلسة وطبيعية بلغاتهم الأصلية تقربنا من هدفنا المتمثل في ربط مليار شخص بالتفاؤل والكياسة.

لزيادة تحسين دقة ترجماتنا وتزويد نموذجنا ببيانات تدريب أفضل، نخطط لطرح أداة للسماح للأشخاص على المنصة بتقديم تعليقات حول ترجماتهم ومساعدة النظام على التحسن بشكل أسرع. وهذا من شأنه أن يمكن أي شخص من إخبارنا عندما يرى شيئًا تمت ترجمته بشكل خاطئ، بل ويقترح ترجمة أفضل يمكننا إضافتها إلى بيانات التدريب لتحسين النموذج بشكل أكبر. 

تتوفر هذه الترجمات اليوم لجميع اللغات الـ 16 التي ندعمها - لكننا بعيدون عن الانتهاء. نخطط لمواصلة تحديث نماذجنا بأحدث أمثلة الترجمة من خلال تجاربنا بالإضافة إلى عبارات الدردشة الشائعة وأحدث العبارات العامية في كل لغة ندعمها. بالإضافة إلى ذلك، ستتيح هذه البنية إمكانية تدريب النموذج على لغات جديدة بجهد منخفض نسبيًا، حيث تتوفر بيانات تدريب كافية لتلك اللغات. علاوة على ذلك، نحن نستكشف طرقًا لترجمة كل شيء تلقائيًا بأبعاد متعددة: النص على الصور، والأنسجة، والنماذج ثلاثية الأبعاد، وما إلى ذلك. 

ونحن نستكشف بالفعل حدودًا جديدة ومثيرة، بما في ذلك التلقائية صوت ترجمات الدردشة. تخيل أن أحد المتحدثين باللغة الفرنسية في Roblox قادر على إجراء محادثة صوتية مع شخص يتحدث الروسية فقط. يمكن لكلاهما التحدث وفهم بعضهما البعض، وصولاً إلى نبرة صوتهما وإيقاعه وعاطفته، بلغتهما الخاصة، وبكمون منخفض. على الرغم من أن هذا قد يبدو مثل الخيال العلمي اليوم، وسيستغرق الأمر بعض الوقت لتحقيقه، إلا أننا سنواصل المضي قدمًا في مجال الترجمة. في المستقبل غير البعيد، سيكون Roblox مكانًا يمكن للأشخاص من جميع أنحاء العالم التواصل فيه بسلاسة ودون عناء ليس فقط عبر الدردشة النصية، ولكن بكل طريقة ممكنة!

بقعة_صورة

أحدث المعلومات الاستخباراتية

بقعة_صورة