يعد التحليل الصرفي خطوة مهمة من خطوات المعالجة الآلية للغات الطبيعية و تطبيقاتها المتنوعة، و يحتاج كل نوع من هذه التطبيقات إلى درجةٍ مختلفة من التوازن بين الأداء و الوثوقية و شمولية النتائج ( إيجاد جميع الحلول المحتملة )؛ ففي حين تهتم بعض التطبيقات بالوثوقية العالية للنتائج، تهتم تطبيقات أخرى بالمحافظة
على أداءٍ فعالٍ للنظام، و تُعنى تطبيقات أخرى بأنظمة تحليلٍ صرفيٍ تنتج كل الحلول الممكنة و بوثوقية عالية.
نقدم في هذا المقال وصفاً موجزاً لمنهجية جديدة لبناء نظام تحليل صرفي للغة العربية يتمتَّع بالمرونة، و يمكن إعداده بحيث يلائم التطبيق الهدف. و قد بينت الاختبارات أن النظام المنجز يحقق مرونة تجعل منه مناسباً للاستخدام في معظم أنواع التطبيقات على اختلاف متطلباتها. كذلك، يتضمن النظام مكوناً مستقلاً يمكن إضافته بسهولة إلى أنظمة التحليل الصرفي الأخرى لتحسين أدائها دون أية آثار سلبية على الدقة أو شمولية النتائج.
Morphological analysis is an important step in natural language processing and its
various applications. Each kind of these applications needs a certain balance between:
performance, accuracy, and generality of solutions (i.e. getting all possible roots); while
we focus on performance with a good accuracy in Information retrieval applications,
we try to achieve high accuracy in systems like pos-tagger and machine translation, and
both high accuracy and high generality in systems like language learning systems and
Arabic lexical dictionaries. In this paper, we describe our approach to build a flexible
and application oriented Arabic morphological analyzer; this approach is designed to
satisfy various requirements of most applications which need morphological processing.
It also provides a separate stage (Original Letters Detection Algorithm) which can be
plugged easily in any Other morphological analyzer to improve its performance, and
with no negative effect on its reliability.
المراجع المستخدمة
Al-Attar. S, Al-Bawab. M, and Al-Dakkak, O.(2007) Arabic Lexical databas. ANLP, ICTIS 2007, fes, Morocco
Al-Bawab, M., Mrayati, M., Alam, Y.M., & Al-Tayyan, M.H. (1994). A computerized morpho-syntactic system of Arabic. The Arabian Journal of Science and Engineering, 19, 461 480. Published by KFUPM, Dhahran, Saudi Arabia
Linguistic Data Consortium (LDC) catalog number LDC2002L49 and ISBN 1-58563- 257-0