شعار زيفيرنت

شرح ملاءمة الحركة للتعرف على النشاط في نماذج التعلم العميق للفيديو. (arXiv: 2003.14285v1 [cs.LG])

التاريخ:

(تم التقديم في 31 مارس 2020)

المستخلص: تم تطوير مجموعة فرعية صغيرة من تقنيات التفسير مبدئيًا للصورة
تم تطبيق نماذج التعرف مؤخرًا من أجل تفسير ثلاثي الأبعاد
نماذج الشبكة العصبية التلافيفية في مهام التعرف على النشاط. يشبه إلى حد كبير
النماذج نفسها ، تتطلب التقنيات تعديلات قليلة أو معدومة
متوافق مع مدخلات 3D. ومع ذلك ، فإن تقنيات التفسير هذه تعتبر مكانية
والمعلومات الزمنية بشكل مشترك. لذلك ، باستخدام تقنيات التفسير هذه ،
لا يمكن للمستخدم أن يميز بوضوح دور الحركة في نموذج ثلاثي الأبعاد
القرار. في الواقع ، لقد ثبت أن هذه النماذج ليست مناسبة
عامل معلومات الحركة في قرارهم. نقترح أهمية انتقائية
طريقة لتكييف تقنيات التفسير ثنائي الأبعاد لتوفير حركة محددة
التفسيرات ، ومواءمتها بشكل أفضل مع الفهم البشري للحركة
منفصلة من الناحية المفاهيمية عن السمات المكانية الثابتة. نظهر فائدة
من طريقتنا جنبًا إلى جنب مع العديد من طرق التفسير ثنائية الأبعاد المستخدمة على نطاق واسع ،
وتبين أنه يحسن انتقائية الشرح للحركة. تظهر نتائجنا
أن طريقة الصلة الانتقائية لا يمكنها فقط توفير نظرة ثاقبة للدور
لعبت بالحركة في قرار النموذج - في الواقع ، كاشفة و
تحديد التحيز المكاني للنموذج - ولكن الطريقة تبسط أيضًا
التفسيرات الناتجة عن الاستهلاك البشري.

تاريخ التقديم

من: ليام هيلي BSc [عرض البريد الإلكتروني]
[v1]
الثلاثاء ، 31 مارس 2020 15:19:04 UTC (1,553 كيلوبايت)

المصدر: http://arxiv.org/abs/2003.14285

بقعة_صورة

أحدث المعلومات الاستخباراتية

بقعة_صورة