نقوم بتقييم فعالية علامات UPOS المتوقعة كيزات مدخلات لمحللات التبعية في إعدادات الموارد المنخفضة لتقييم كيفية تأثير حجم TreeBank على دقة وضع العلامات على أداء التحليل.نقوم بذلك للحصول على Treebanks Universal TreeBanks Universal Resource Universal Desultency، وبيانات الموارد منخفضة مصطنع بأحجام متفاوتة من TreeBank، وللغة Treebanks الصغيرة جدا بكميات متفاوتة من البيانات المعززة.نجد أن علامات UPOS المتوقعة مفيدة إلى حد ما بالنسبة إلى جانب Lowerbanks Lower Treebanks، خاصة عند توفر المزيد من الأشجار المشروح بالكامل.نجد أيضا أن هذا التأثير الإيجابي يقلل من زيادات البيانات.
We evaluate the efficacy of predicted UPOS tags as input features for dependency parsers in lower resource settings to evaluate how treebank size affects the impact tagging accuracy has on parsing performance. We do this for real low resource universal dependency treebanks, artificially low resource data with varying treebank sizes, and for very small treebanks with varying amounts of augmented data. We find that predicted UPOS tags are somewhat helpful for low resource treebanks, especially when fewer fully-annotated trees are available. We also find that this positive impact diminishes as the amount of data increases.
المراجع المستخدمة
https://aclanthology.org/
تقدم هذه الورقة نظام تحليل التبعية متعدد اللغات كما هو مستخدم في المهمة المشتركة IWPT 2021 على التحليل في التبعيات العالمية المعززة.يتكون نظامنا من مصنف BiAffine غير المعسم الذي يعمل مباشرة على مدينتي XLM-R التي تم ضبطها بشكل مباشر ويولد الرسوم البيا
وصفنا تقديم Edinsaar إلى المهمة المشتركة للترجمة ذات الموارد متعددة اللغات لغات شمال الجرمانية في المؤتمر السادس حول الترجمة الآلية (WMT2021).نقدم نماذج الترجمة متعددة اللغات للترجمات من / إلى الأيسلاندية (IS)، Norwegian-bokmal (NB)، والسويدية (SV).ن
إن دمج طرائق الإدخال المتعددة في نظام الترجمة الآلي (MT) يكتسب شعبية بين الباحثين MT. على عكس مجموعة البيانات المتاحة للجمهور لمهام ترجمة الآلات متعددة الوسائط، حيث تكون التسميات التوضيحية أوصاف صورة قصيرة، توفر التعليق الأخبار وصفا أكثر تفصيلا لمحتو
تصف هذه الورقة معيارا متاحا بحرية على شبكة الإنترنت يسمى HB DEID.تحدد DED HB ما يسمى بالمعلومات الصحية المحمية، PHI، في نص مكتوب باللغة السويدية والأقنعة أو استبدالها مع بدائل أو سرية.يتم تسمية فيس كيانات مثل الأسماء الشخصية والمواقع والأعمار وأرقام
ترجمة آلة متعددة الوسائط (MMT) تثري النص المصدر بمعلومات مرئية للترجمة.لقد اكتسبت شعبية في السنوات الأخيرة، وقد اقترح العديد من خطوط الأنابيب في نفس الاتجاه.ومع ذلك، تفتقر المهمة إلى مجموعات بيانات الجودة لتوضيح مساهمة الوسيلة البصرية في أنظمة الترجم