غالبا ما تحتوي نصوص وسائل التواصل الاجتماعي مثل منشورات المدونة والتعليقات والتغريدات بلغات هجومية بما في ذلك تعليقات خطاب الكراهية العنصرية والهجمات الشخصية والتحرش الجنسي.لذلك اكتشاف الاستخدام غير المناسب للغة هو أهمية قصوى لسلامة المستخدمين وكذلك لقمع السلوك البغيض والعدوان.الأساليب الحالية لهذه المشكلة متاحة في الغالب لغات غنية بالموارد مثل الإنجليزية والألمانية.في هذه الورقة، نميز اللغة المسيئة في النيبالية، وهي لغة موارد منخفضة، تسليط الضوء على التحديات التي يجب معالجتها لمعالجة نص وسائل الإعلام الاجتماعية النيبالية.نقدم أيضا تجارب للكشف عن اللغة المسيئة باستخدام تعلم الآلات الخاضعة للإشراف.إلى جانب المساهمة في أول مناهج خط الأساس في الكشف عن اللغة الهجومية في النيبالية، نطلق أيضا على مجموعات البيانات المشروح البشرية لتشجيع البحث في المستقبل على هذا الموضوع الحاسم.
Social media texts such as blog posts, comments, and tweets often contain offensive languages including racial hate speech comments, personal attacks, and sexual harassment. Detecting inappropriate use of language is, therefore, of utmost importance for the safety of the users as well as for suppressing hateful conduct and aggression. Existing approaches to this problem are mostly available for resource-rich languages such as English and German. In this paper, we characterize the offensive language in Nepali, a low-resource language, highlighting the challenges that need to be addressed for processing Nepali social media text. We also present experiments for detecting offensive language using supervised machine learning. Besides contributing the first baseline approaches of detecting offensive language in Nepali, we also release human annotated data sets to encourage future research on this crucial topic.
المراجع المستخدمة
https://aclanthology.org/
السخرية عبارة عن تعبير لغوي يستخدم في كثير من الأحيان للتواصل مع عكس ما يقال، وعادة ما يكون شيئا غير سار للغاية بقصد الإهانة أو السخرية.الغموض الكامنة في التعبيرات الساخرة يجعل اكتشاف السخرية صعبة للغاية.في هذا العمل، نركز على الكشف عن السخرية في محا
في هذه الورقة ندرس لغة Pejorative، موضوعا غير متوقع في اللغويات الحسابية.على عكس النماذج الحالية من اللغة الهجومية وكلاب الكراهية، تظهر لغة Pejorative نفسها في المقام الأول على المستوى المعجمي، وتوضح كلمة تستخدم مع دلالة سلبية، مما يجعلها مختلفة عن ا
في الوقت الحاضر، هناك الكثير من الإعلانات التي تختبئ كوظائف طبيعية أو مشاريع خبرة في وسائل التواصل الاجتماعي.هناك القليل من البحوث في الكشف عن الإعلانات على النصوص الصينية الماندرين.وهكذا تهدف هذه الورقة إلى التركيز على الكشف الإعلامي المخفي عن المشا
تصف هذه الورقة إدخال مجموعة الأبحاث سيناء في مهمة SMM4H الرئيسية على تحديد المهن والمهن في وسائل التواصل الاجتماعي ذات الصلة بالصحة.على وجه التحديد، شاركنا في المهمة 7A: Tweet تصنيف ثنائي لتحديد ما إذا كانت تغريدة تحتوي على تذوق من المهن أم لا، وكذلك
يستخدم عمل خطاب الشكوى من قبل البشر للتواصل مع عدم وجود عدم تطابق سلبي بين الواقع والتوقعات كرد فعل على وضع غير موات. تصنف النظرية اللغوية للبراغماتية شكاوى إلى مستويات شدة مختلفة تعتمد على تهديد الوجه الذي يرغب فيه الشكوى في القيام به. هذا مفيد بشكل