يعمل العمل الحديث في محاولات تعدين الحجة عبر الموضوعات لتعلم النماذج التي تعزز عبر الموضوعات بدلا من الاعتماد فقط على الارتباطات الزائفة داخل الموضوع.نحن ندرس فعالية هذا النهج من خلال تحليل إخراج النماذج ذات المهمة الفردية ومتعدد المهام للتطوير عبر الموضوعات التعدين، من خلال مزيج من تقريبية خطية من حدود قراراتهم، وتجميع الميزات اليدوية، أمثلة التحدي، والاعتبارات عبر المدخلاتكلمات.من المستغرب أن نوضح أن النماذج عبر الموضوعات لا تزال تعتمد في الغالب على ارتباطات زائفة وتعميم فقط داخل مواضيع مرتبطة ارتباطا وثيقا، على سبيل المثال، نموذج مدرب فقط على الكلمات الفئة المغلقة وبعض الكلمات المفتوحة الشائعة تفوقت على حالة منالفن المتبادل نموذج المواضيع المستهدفة البعيدة.
Recent work in cross-topic argument mining attempts to learn models that generalise across topics rather than merely relying on within-topic spurious correlations. We examine the effectiveness of this approach by analysing the output of single-task and multi-task models for cross-topic argument mining, through a combination of linear approximations of their decision boundaries, manual feature grouping, challenge examples, and ablations across the input vocabulary. Surprisingly, we show that cross-topic models still rely mostly on spurious correlations and only generalise within closely related topics, e.g., a model trained only on closed-class words and a few common open-class words outperforms a state-of-the-art cross-topic model on distant target topics.
المراجع المستخدمة
https://aclanthology.org/
من بين القيود الأكثر أهمية في نماذج NLP التعليمية العميقة هي عدم قابلية الترجمة الشفوية، واعتمادها على الارتباطات الزائفة.اقترح العمل السابق مناهج مختلفة لتفسير نماذج الصندوق الأسود للكشف عن الارتباطات الزائفة، ولكن تم استخدام البحث في المقام الأول ف
بعد أداء متزايد لأنظمة الترجمة الآلية العصبية، تتم الآن دراسة نموذج استخدام البيانات المترجمة تلقائيا للتكيف عبر اللغات في العديد من المجالات المعمارية.لا تزال القدرة على شرح المشروع بدقة، ومع ذلك، فإن هناك مشكلة في مهام علامات التسلسل حيث يجب توقع ا
يتطلب محتوى الوسائط الاجتماعية المتغيرة بسرعة لنماذج الكشف عن إساءة الاستخدام قوية وممتع.ومع ذلك، فإن النماذج الخاضعة للإشراف على أحدث حدوث عرض الأداء المتدهورة عند تقييمها بشأن التعليقات المسيئة التي تختلف عن Training Corpus.نحقق في ما إذا كان أداء
الحجج عالية الجودة هي جزء أساسي من صنع القرار.توقع جودة الوسيطة تلقائيا هي مهمة معقدة حصلت مؤخرا على الكثير من الاهتمام في تعدين الحجة.ومع ذلك، فإن جهود التوضيحية لهذه المهمة مرتفعة بشكل استثنائي.لذلك، نختبر أساليب التعلم النشطة القائمة على عدم اليقي
تحليل Coreference Event Dockence (CDCR) هي مهمة تحديد الأحداث التي تشير إلى نفس الأحداث طوال مجموعة من المستندات. تعد شرح بيانات CDCR عملية شاقة ومكلفة، موضحا سبب وجود كورسا الموجودة صغيرة وتفتقر إلى تغطية المجال. للتغلب على هذه الاختناق، نستخلك تلقا