ترغب بنشر مسار تعليمي؟ اضغط هنا

تستخدم مصطلح خطط الترجغ على نطاق واسع في معالجة اللغة الطبيعية واسترجاع المعلومات. على وجه الخصوص، فإن وزن المصطلح هو الأساس لاستخراج الكلمات الرئيسية. ومع ذلك، هناك عدد قليل نسبيا دراسات التقييم التي ألقت الضوء على نقاط القوة وأوجه القصور في كل مخطط للتوازن. في الواقع، في معظم الحالات، يلجأ الباحثون والممارسون في معظم الحالات إلى TF-IDF المعروفة بشكل افتراضي، على الرغم من وجود بدائل أخرى مناسبة، بما في ذلك النماذج القائمة على الرسم البياني. في هذه الورقة، نقوم بإجراء مقارنة تجريبية وشاملة واسعة النطاق من كل من أساليب الترجيح الإحصائية والرصاص القائمة على الرسم البياني في سياق استخراج الكلمات الرئيسية. يكشف تحليلنا عن بعض النتائج المثيرة للاهتمام مثل مزايا الخصوصية المعروفة الأقل شهرة فيما يتعلق ب TF-IDF، أو الاختلافات النوعية بين الأساليب الإحصائية والرصاص القائمة على الرسم البياني. وأخيرا، بناء على نتائجنا نناقشها واستنباد بعض الاقتراحات للممارسين. تعد شفرة المصدر لإعادة إنتاج نتائجنا التجريبية، بما في ذلك مكتبة استخراج الكلمات الرئيسية، متوفرة في المستودع التالي: https://github.com/asahi417/kex
تهدف استخراج الأجل إلى الجانب إلى استخراج مصطلحات الجانب من جملة مراجعة قد أعرب المستخدمين عن آرائهم.واحدة من التحديات المتبقية لاستخراج مصطلح الجانب موجودة في الافتقار إلى البيانات المشروحة المكافحة.في حين أن التدريب الذاتي يحتمل أن يكون هناك طريقة فعالة لمعالجة هذه المسألة، فإن تسميات الزائفة التي تقوم بتسليمها على البيانات غير المسبقة قد تحفز الضوضاء.في هذه الورقة، نستخدم وسيلة اثنين لتخفيف الضوضاء في الملصقات الزائفة.واحد هو أنه مستوحى من تعلم المناهج الدراسية، ونحن نؤيد التدريب الذاتي التقليدي للتدريب الذاتي التدريجي.على وجه التحديد، ينطني النموذج الأساسي بالملصقات الزائفة في مجموعة فرعية تقدمية في كل تكرار، حيث تصبح العينات في المجموعة الفرعية أكثر صعوبة وأكثر كثرة في عائدات التكرار.والآخر هو أن نستخدم تمييزا لتصفية الملصقات الزائفة الصاخبة.تظهر النتائج التجريبية على أربعة مجموعات من مجموعات بيانات Sereval أن طرازنا تتفوق بشكل كبير على الأساس السابقة وتحقق أداء حالة من الفن.
تم اقتراح نماذج إتمام المعرفة الزمنية المختلفة (KG) في الأدب الحديث. تحتوي النماذج عادة على جزأين، وهي طبقة تضمين زمنية ووظيفة نتيجة مشتقة من نهج النمذجة الثابتة الحالية. نظرا لأن النهج تختلف عدة أبعاد، بما في ذلك وظائف النتيجة المختلفة واستراتيجيات التدريب، فإن المساهمات الفردية في تقنيات التضمين الزمنية المختلفة لنموذج الأداء ليست واضحة دائما. في هذا العمل، ندرس بشكل منهجي ستة مناهج تضمين الزمنية وقياس أدائها تجريبيا عبر مجموعة واسعة من التكوينات مع حوالي 3000 تجربة و 13159 ساعة GPU. نقوم بتصنيف الأشرطة الزمنية إلى فئتين: (1) embeddings timestamp و (2) تضمين كيان تعتمد على الوقت. على الرغم من الاعتقاد المشترك بأن الأخير أكثر تعبيرية، تظهر دراسة تجريبية واسعة النطاق أن تضمين الطابع الزمني يمكن أن تحقق أداء على قدم المساواة أو أفضل مع المعلمات أقل بكثير. علاوة على ذلك، نجد أنه عند التدريب بشكل مناسب، غالبا ما تتقلص فروق الأداء النسبية بين مختلف الأشرطة الزمنية وأحيانا حتى عكسها عند مقارنتها بالنتائج السابقة. على سبيل المثال، يمكن أن تتفوق TTRANSE (CIRING)، واحدة من نماذج KG الزمنية الأولى، الفضلات الأخرى في مجال بيانات ICEWS. لتعزيز المزيد من الأبحاث، نحن نقدم أول إطار موحد مفتوح المصدر لنماذج إكمال KG الزمنية مع توصيف كامل، حيث يمكن الجمع بين المدينين الزمني ووظائف النتيجة ووظائف الخسائر والدعوانات والنمذجة الصريحة للعلاقات المتبادلة بشكل تعسفي.
استخراج الرأي المستهدف واستخراج الأجل رأي هما مهمتان أساسيتان في تحليل المعرفات القائم على الجانب (ABASA). تركز العديد من الأعمال الأخيرة على ABSA على استخراج كلمات الرأي الموجهة نحو الهدف (TOWE) (Towe)، والتي تهدف إلى استخراج كلمات الرأي المقابلة لل حصول على هدف رأي معين. يمكن تطبيق Towe أكثر استخداما على استخراج زوج الرأي في الجانب (AOPE) الذي يهدف إلى استخراج الجوانب (أي أهداف الرأي) وشروط الرأي في أزواج. في هذه الورقة، نقترح تسلسل تسلسل محدد بالهدف مع اهتمام الذات متعدد الرأس (TSMSA) ل Towe، حيث يمكن دمج أي نموذج لغة مدرب مسبقا مع اهتمام ذاتي متعدد الرأس بشكل مريح. كدراسة حالة، نقوم أيضا بتطوير هيكل متعدد المهام يدعى MT-TSMSA من أجل الجمع بين TSMSA لدينا مع وحدة استخراج الجانب والرأي. تشير النتائج التجريبية إلى أن TSMSA تتفوق على الأساليب القياسية على Towe بشكل ملحوظ؛ وفي الوقت نفسه، فإن أداء MT-TSMSA متشابه أو حتى أفضل من نماذج خط الأساس الحديثة.
تحليل المعنويات المستندة إلى جانب الجسيم (ABASA)، تهدف إلى التنبؤ بأقطاب الجوانب، هي مهمة جيدة المحبوس في مجال تحليل المعنويات. وأظهر العمل السابق معلومات النحوية، على سبيل المثال أشجار التبعية، يمكن أن تحسن بشكل فعال أداء ABSA. في الآونة الأخيرة، أظ هرت النماذج المدربة مسبقا (PTMS) أيضا فعاليتها على ABAMA. لذلك، تنشأ السؤال بشكل طبيعي ما إذا كانت PTMs تحتوي على معلومات نصنية كافية ل ABAMA حتى نتمكن من الحصول على نموذج ABSA جيد فقط بناء على PTMS. في هذه الورقة، نقارن أولا الأشجار المستحثة من PTMS وأشجار تحليل التبعية في العديد من النماذج الشعبية لمهمة ABASA، والتي توضح أن الشجرة المستحقة من روبرتا الصعبة (FT-Roberta) تتفوق على الشجرة التي قدمتها المحلل المحاور. تكشف تجارب التحليل الإضافي أن شجرة FT-Roberta المستحقة أكثر من المعنويات - الموجهة إلى كلمة ويمكن أن تفيد مهمة ABASA. تشير التجارب أيضا إلى أن النموذج النقي المستند إلى روبرتا يمكن أن تفوق أو تقريب من عروض SOTA السابقة على ست مجموعات بيانات عبر أربع لغات لأنها تتضمن ضمنيا المعلومات الأساسية الموجهة نحو المهام.
يعالج البحث قضية المصطلح اللساني العربي، و يحاول توصيف مشكلاته القائمة، و تحديد أسبابها؛ ليصل إلى نتائج علميةٍ تعينه على تقديم الحلول لها، فيعرض بدايةً طبيعة علم المصطلح و آلياته العلمية و علاقته باللسانيات، ثم يجمل القول على خصائص المصطلح العلمي، و يحدد ما يتميز به عن مفردات اللغة الأخرى، و ينتقل بعد ذلك إلى الخوض في غمار مشكلات المصطلح اللساني العربي، فيَصِف واقعه، و يعرض مشكلاته التي تزعزع خصائصه الاصطلاحية، و يحاول تحديد أسبابها، و تقديم المقترحات لتجاوزها، كما يعرض جهود المؤسسات اللغوية العربية في حل هذه المشكلات، و يناقش الهنات و نقاط الضعف التي أدت إلى إبعادها عن تحقيق غايتها، و يناقش إشكالية استخدام المصطلح اللغوي العربي التراثي في مقابل المفاهيم اللسانية المستحدثة، فيعرض الآراء المتباينة حول هذه الإشكالية، و يقدم رؤيته مسوغاً لها، و يخلص إلى تكثيف نتائجه في خاتمة يقدم فيها بعض التوصيات التي يراها ناجعةً في حل مشكلات المصطلح اللساني العربي.
يبدو أن تحديدَ مفهوم التجريب من حيث الدلالات المفهومية والمعاني الاصطلاحية أمرٌ أساسيٌ لا محيد عنه، لكثرة تداوله وشيوعه بين الباحثين المختصين، وغير المختصين إضافة إلى ما يتضمنه هذا المفهوم من تنويع في الأساليب الفنية والأدوات الإجرائية من جهة، وما يح مله من نضج فكري وبعد إيديولوجي من جهة أخرى، لذلك يقدم هذا البحث دراسة توضيحية لمفهوم التجريب بدءاً من دلالته اللغوية والاصطلاحية، مروراً بعلاقته مع مفاهيم مقترنة به مثل مفهوم الحداثة والأصالة والتغريب، ليؤكد بذلك أن التجريب مفهوم وليس مصطلحاً، وأنه ليس تقنية بقدر ما هو تعبير عن مواقف أو رؤى فلسفية وجودية وجمالية وتاريخية تحكم مجمل العملية الإبداعية.
يسلط البحث الضوء على مفهوم الكم و الحجية و مصطلح الحديث، كما يوضح أثر الكم و حجيته في العلوم الطبيعية و العلوم الإنسانية، فضلاً عن بيان أثر الكم في ضبط مفاهيم مصطلح الحديث، كالعزيز و المشهور و المتواتر و نحوها، و كذلك بيان أثر الكم في ضبط قواعد مصطلح الحديث.
أخذت أغلب الروايات الفلسطينية اتجاهاً واقعياً بعد النكبة , وحملت على عاتقها نقل هموم الإنسان الفلسطيني ومعاناته , في مجتمعٍ يرزح تحت عنف الاحتلال وقسوته , وتحولت مهمّة الروائي الفلسطيني إلى مهمّةٍ نضاليةٍ جماليةٍ , هدفها تصوير الواقع المضطرب بصدق وأم انة ، ورصد إيقاع الحياة اليومية , وكل التحولات التي يعيشها الفلسطيني تحت الاحتلال , إذ أصبحت الرواية الفلسطينية تقدّم رؤية بانورامية لأبعاد الواقع , بكل ما يحفل به من معاناة وتمرّد ومواجهة. وانطلاقاً من أهمية الرواية الفلسطينية بوصفها مجالاً خصباً للدراسة , فقد اخترت روايات الكاتبة الفلسطينية ( سحر خليفة ) مضماراً لهذا البحث ، لما تتسم به أعمالها من خصوصية نسوية , ومن أسلوب سردي متميز, وجرأة في طرح قضايا الواقع بأسلوب مباشر ولغة شفافة، بالإضافة إلى عدم وجود دراسة مستقلة - في حدود اطلاعي - تتناول أعمالها الروائية , فكل ما عثرتُ عليه لا يتجاوز بعض الدراسات والمقالات التي تناولت بعض النتاج الروائي للكاتبة، منها كتاب ( شعرية الفضاء السردي ) للدكتور حسن نجمي ، الذي خُصِّص لدراسة المكان في بعض أعمالها الروائية ، وكتاب (الخطاب الروائي والقضايا الكبرى) لمحمد معتصم، درس فيه الكاتب النزعة الإنسانية في بعض روايات الكاتبة, ومقالة للدكتورة بثينة شعبان بعنوان " سحر خليفة وامرأة غير واقعية "، ومقالة للدكتورة ماجدة حمود بعنوان " المرأة في روايات سحر خليفة "، وغيرها من الدراسات المتفرقة التي لم تفِ الكاتبة حقّها من البحث الموسّع، والدراسة الوافية والشاملة لنتاجها الأدبي. ويهدف هذا البحث إلى دراسة أسلوب الكاتبة الروائي , و أهم مكوّنات السرد في أعمالها, وعلاقته بغيره من المكوّنات الروائية , وتعتمد الدراسة المنهج البنيوي التكويني ؛ لأنه يُعنى بتحليل النص السردي بوصفه نصّاً متعدّد المستويات الدلالية ، كما يحاول الإفادة من معطيات كل من المنهجَيْن الاجتماعي والنفسي في تحليل الشخصيات الروائية ، ودراسة علاقتها بالمكونات السردية الأخرى , ويبقى هدف هذا البحث هو الولوج إلى عالم النص الروائي , وتفكيك بنيته الفنية , بغية الوقوف على تفاصيل العالم الروائي للكاتبة . ولقد تمّ تقسيم البحث إلى مقدمة وستة فصول وخاتمة. تتحدث المقدمة عن علاقة الرواية الفلسطينية بالواقع بكل أبعاده , أما الفصل الأول محطات أولية ، فيتناول التعريف بالكاتبة وأعمالها الروائية , ومن ثم دراسة مصطلح السرد وتعدد المفاهيم حوله. ويأتي الفصل الثاني ليدرس مستويات الرؤية السردية , فيبين منظور السرد، والموقع الذي اتخذه السارد في الرواية , ثم يدرس أنماط السرد، وسماتها، وأسلوب توظيفها داخل العمل الروائي. ويتناول الفصل الثالث دور السرد في بناء الشخصية الروائية ، فيدرس طريقة تقديمها وتصنيفها، وعلاقتها بالحدث الروائي . ويُعنى الفصل الرابع بأهمية المكان، وعلاقته بالشخصية، وسائر المكونات الروائية, ودور الوصف في إبراز التضاريس المكانية ودلالاتها. أما الفصل الخامس فيدرس خصوصية الزمن الفلسطيني، وأبعاده الدلالية، وسائر التقنيات الزمنية الأخرى. ويتناول الفصل السادس دراسة اللغة بمستوياتها المختلفة , وأهم السمات الأسلوبية التي اتسمت بها روايات الكاتبة، ثم يُختم البحث بأبرز النتائج التي يمكن للدراسة أن تتوصل إليها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا