ترغب بنشر مسار تعليمي؟ اضغط هنا

المهمة المشتركة Eval4NLP على تقدير الجودة القادم: نظرة عامة

The Eval4NLP Shared Task on Explainable Quality Estimation: Overview and Results

209   0   0   0.0 ( 0 )
 تاريخ النشر 2021
  مجال البحث الذكاء الاصناعي
والبحث باللغة English
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

في هذه الورقة، نقدم المهمة المشتركة ESPR4NLP-2021 على تقدير الجودة القادم.بالنظر إلى زوج ترجمة من المصدر، فإن هذه المهمة المشتركة لا تتطلب فقط توفير درجة على مستوى الجملة تشير إلى الجودة الشاملة للترجمة، ولكن أيضا لشرح هذه النقاط عن طريق تحديد الكلمات التي تؤثر سلبا على جودة الترجمة.نقدم البيانات وإرشادات التوضيحية وإعداد تقييم المهمة المشتركة، وصف النظم الستة المشاركة وتحليل النتائج.إلى حد ما من معرفتنا، هذه هي المهمة المشتركة الأولى على مقاييس تقييم NLP القابلة للتفسير.تتوفر مجموعات البيانات والنتائج في https://github.com/eval4nlp/sharedtask2021.

المراجع المستخدمة
https://aclanthology.org/
قيم البحث

اقرأ أيضاً

شهد حقل NLP مؤخرا زيادة كبيرة في العمل المتعلق بتكاثر النتائج، وأكثر اعترافا بشكل عام بأهمية وجود تعريفات وممارسات مشتركة تتعلق بالتقييم. وقد تركز الكثير من العمل على الاستيلاء على الدرجات المترية حتى الآن، مع استنساخ نتائج التقييم البشرية التي تتلقى اهتماما أقل بكثير. كجزء من برنامج بحثي مصمم لتطوير نظرية وممارسة تقييم استنساخ في NLP، نظمت المهمة المشتركة الأولى بشأن استنساخ التقييمات البشرية، وتوبيخ 2021. تصف هذه الورقة المهمة المشتركة بالتفصيل، تلخص النتائج من كل مجال من دراسات الاستنساخ قدمت، ويوفر المزيد من التحليل المقارن للنتائج. من بين تسع تسجيلات الفريق الأولية، تلقينا عروض من أربعة فرق. كشف التحليل التلوي لدراسات الاستنساخ الأربعة عن درجات متفاوتة من التكاثر، وسمحت باستنتاجات أولية مبدئية للغاية حول أنواع التقييم التي تميل إلى تحسين استنساخ أفضل.
نقدم نظرة عامة على المهمة المشتركة السكري، التي قدمت في ورشة عمل المعالجة بالوثائق العلمية الثانية (SDP) في Naacl 2021. وفي هذه المهمة المشتركة، قدمت النظم مطالبة علمية وجزح من ملخصات البحث، وطلب تحديد المقالات التي تدعمهاأو دحض المطالبة وكذلك توفير جمل إثبات تبرير هذه الملصقات.11 قدمت فرق ما مجموعه 14 تقريرا إلى المتصدرين المهمة المشتركة، مما يؤدي إلى تحسين أكثر من +23 F1 على متري تقييم المهام الأساسية.بالإضافة إلى مسح النظم المشاركة، فإننا نقدم العديد من الأفكار في نهج النمذجة لدعم التقدم المحرز المستمر والبحث في المستقبل حول المهمة المهمة والصعبة للتحقق من الادعاء العلمي.
نقدم المساهمة المشتركة في IST و Grongel بمهمة WMT 2021 المشتركة بشأن تقدير الجودة.شارك فريقنا في مهمتين: التقييم المباشر وجهد التحرير بعد، يشمل ما مجموعه 35 تقريرا.بالنسبة لجميع التقديمات، ركزت جهودنا على تدريب النماذج متعددة اللغات على رأس الهندسة ا لمعمارية المتنبئة ل OpenKiwi، باستخدام ترميزات متعددة اللغات المدربة مسبقا جنبا إلى جنب مع المحولات.نؤدي إلى مزيد من التجربة والأهداف والميزات المرتبطة بعدم اليقين بالإضافة إلى التدريب على بيانات التقييم المباشر خارج المجال.
توفر هذه الورقة نظرة عامة على المهمة المشتركة WANLP 2021 بشأن السخرية والكشف عن المعنويات باللغة العربية.المهمة المشتركة لها مفتاحان فرعي: الكشف عن السخرية (الفرعية 1) وتحليل المعرفات (SubTask 2).تهدف هذه المهمة المشتركة إلى الترويج والاهتمام بالكشف عن السخرية العربية، وهو أمر بالغ الأهمية لتحسين الأداء في مهام أخرى مثل تحليل المعرفات.تتكون DataSet المستخدمة في هذه المهمة المشتركة، وهي Arsarcasm-V2، من 15،548 تغريدات تسمى السخرية والشعور واللهجة.تلقينا 27 و 22 عروضا للمجموعات الفرعية 1 و 2 على التوالي.تعتمد معظم النهج على استخدام النماذج اللغوية المدربة مسبقا وضبطها جيدا مثل أرابيرت وماربرت.وكانت أفضل النتائج التي تحققت في مهام تحليل السخرية وتحليل المعنويات 0.6225 F1 و 0.748 F1-PN على التوالي.
نبلغ عن نتائج المهمة المشتركة WMT 2021 بشأن تقدير الجودة، حيث يتحدى التحدي هو التنبؤ بجودة إخراج أنظمة الترجمة الآلية العصبية على مستوى الكلمة ومستويات الجملة.ركزت هذه الطبعة على إضافات رواية رئيسيتين: (1) التنبؤ باللغات غير المرئية، أي إعدادات صفرية ، و (2) التنبؤ بالأحكام ذات الأخطاء الكارثية.بالإضافة إلى ذلك، تم إصدار بيانات جديدة لعدة من اللغات، وخاصة البيانات التي تم تحريرها بعد التحرير.قدمت الفرق المشاركة من 19 مؤسسة تماما 1263 أنظمة لمتغيرات المهام المختلفة وأزواج اللغة.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا