ترغب بنشر مسار تعليمي؟ اضغط هنا

أداء نظام تصنيف الأشكال في الصورة باستخدام الشبكات العصبونية الالتفافي

Performance of Objects Classification System in an Image using Convolutional Neural Networks

1232   1   11   0.0 ( 0 )
 تاريخ النشر 2019
  مجال البحث الهندسة المعلوماتية
والبحث باللغة العربية
 تمت اﻹضافة من قبل Shamra Editor




اسأل ChatGPT حول البحث

في السنوات الأخيرة نمت مشكلة تصنيف الكائنات في الصّور نتيجة لمتطلبات القطاع الصناعي.على الرّغم من تعدد التقنيات المستخدمة للمساعدة في عملية التصنيف SIFT Scale Invariant Feature Transforms، ORB Oriented Fast And Rotated Brief , SURF Speed Up Robust Features، إضافة لشبكات التعلم العميق Deep Learning Neural Network DNN والشبكات العصبونية الالتفافية Convolutional Neural Network CNN، فإن الأنظمة المقترحة لمعالجة هذه المشكلة تفتقر للحل الشّامل للصعوبات المتمثلة بوقت التّدريب الطّويل والذاكرة العائمة أثناء عملية التدريب، وانخفاض معدّل التصنيف. تعتبر الشبكات العصبونية الالتفافيةConvolutional Neural Networks (CNNs) من أكثر الخوارزميات استخداما لهذه المهمة، فقد كانت نموذجا حسابيا لتحليل البيانات الموجودة في الصور. تم اقتراح نموذج شبكة التفافية عميقة جديد لحل المشاكل المذكورة أعلاه. يهدف البحث إلى إظهار أداء نظام التّعرف باستخدام شبكاتCNNs على الذّاكرة المتاحة وزمن التدريب وذلك من خلال منهجة متغيرات مناسبة للشبكة العصبونية الالتفافية. قاعدة البيانات المستخدمة في هذا البحث هي CIFAR10 المكونة من60000 صورة ملونة تنتسب لعشرة أصناف، حيث أن كل 6000 صورة تكون لصنف من هذه الأصناف. يوجد 50000 صورة للتدريب و 10000 صورة للاختبار. حقق النموذج لدى اختباره على عينة من الصور المنتقاة من قاعدة البيانات CIFAR10 معدل تصنيف 98.87%.


ملخص البحث
تناولت الورقة البحثية مشكلة تصنيف الكائنات في الصور باستخدام تقنيات التعلم العميق، مع التركيز على الشبكات العصبونية الالتفافية (CNN). تم اقتراح نموذج جديد للشبكة العصبونية الالتفافية بهدف تحسين الأداء من حيث وقت التدريب واستهلاك الذاكرة. استخدمت قاعدة بيانات CIFAR-10 التي تحتوي على 60000 صورة ملونة موزعة على عشرة أصناف. حقق النموذج المقترح دقة تصنيف بلغت 98.87% عند اختباره على عينة من الصور. تم تنفيذ عملية التدريب على حاسوب شخصي باستخدام برنامج ماتلاب، وتضمنت مراحل العمل معالجة مسبقة للصور، تدريب النموذج، واختبار الأداء. أظهرت النتائج تفوق النموذج المقترح في تقليل التعقيد الحسابي واستهلاك الذاكرة، مما يجعله مناسبًا للاستخدام في الأجهزة المحمولة والتطبيقات العملية مثل رعاية المكفوفين.
قراءة نقدية
دراسة نقدية: تعتبر الورقة البحثية خطوة مهمة في مجال تصنيف الكائنات باستخدام الشبكات العصبونية الالتفافية، إلا أن هناك بعض النقاط التي يمكن تحسينها. أولاً، كان من الممكن تقديم مقارنة أكثر تفصيلاً بين النموذج المقترح والنماذج الأخرى الموجودة في الأدبيات لتوضيح الفروق بشكل أكبر. ثانياً، لم يتم التطرق بشكل كافٍ إلى تأثير حجم البيانات المستخدمة في التدريب على أداء النموذج، حيث يمكن أن يكون لحجم البيانات تأثير كبير على دقة التصنيف. ثالثاً، كان من الممكن تقديم تحليل أعمق لتأثير مختلف البرامترات المستخدمة في النموذج على الأداء النهائي. وأخيراً، يمكن أن تكون هناك حاجة إلى تجربة النموذج على قواعد بيانات أخرى للتأكد من عمومية النتائج.
أسئلة حول البحث
  1. ما هي قاعدة البيانات المستخدمة في البحث؟

    قاعدة البيانات المستخدمة هي CIFAR-10، التي تحتوي على 60000 صورة ملونة موزعة على عشرة أصناف.

  2. ما هي دقة التصنيف التي حققها النموذج المقترح؟

    حقق النموذج المقترح دقة تصنيف بلغت 98.87% عند اختباره على عينة من الصور.

  3. ما هي المراحل التي تضمنها البحث؟

    تضمن البحث مراحل المعالجة المسبقة للصور، تدريب النموذج، واختبار الأداء.

  4. ما هي التوصيات التي قدمها البحث للاستخدام العملي للنموذج؟

    يوصي البحث باستخدام النظام في مجال رعاية الأشخاص المكفوفين من خلال ابتكار أجهزة يحملونها للتعرف على الكائنات الملتقطة من كاميرا يحملونها في أيديهم.


المراجع المستخدمة
Roy, S. S., Ahmed, M., & Akhand, M. A. H.,”Noisy image classification using hybriddeep learning methods”, Journal of ICT, 18, No. 2 (April) 2018, pp: 233–269.
قيم البحث

اقرأ أيضاً

تدرس هذه المقالة منهجية جديدة لتحديد وجود العطل من عدمه، و تصنيف الاعطال في الوقت الحقيقي بالاعتماد على الشبكات العصبونية في خطوط نقل القدرة الكهربائية. تعتمد هذه الخوارزمية على استخدام إشارات الجهود، و التيارات بوصفها يمثل دخل للشبكات العصبونية بعد تقطيعها بتردد تقطيع 1 KHz، و بدون استخدام نافذة بيانات متحركة، حيث ان إشارات الدخل تعالج لحظياً على شكل سلسلة من البيانات المتلاحقة. يعتمد النموذج على ثلاث شبكات عصبونية يعالج كل منها بيانات طور من الأطوار بالإضافة الى شبكة عصبونية رابعة للجهد و التيار الصفريين. يتمكن هذا النظام من تحديد نوع العطل خلال زمن لا يتجاوز الـ 5 ميلي ثانية. تتطلب أنظمة القدرة الحديثة تقنية دقيقة و سريعة للمعالجة في الوقت الحقيقي. تبين دراسات المحاكاة أن التقنية المقترحة قادرة على تمييز حالات العطل المختلفة بشكل دقيق جداً، و قد نجحت هذه التقنية في تحديد جميع أنواع الأعطال تحت شروط النظام المختلفة، بالتالي فإنها دقيقة بنسبة 100% و مناسبة للتطبيق في الزمن الحقيقي.
يتم تطبيق مصنف النصوص بانتظام على النصوص الشخصية، وترك مستخدمي هذه المصنفين عرضة لخرق الخصوصية.نقترح حلا لتصنيف النص الذي يحفظه الخصوصية التي تعتمد على الشبكات العصبية التنافعية (CNNS) والحساب الآمن متعدد الأحزاب (MPC).تتيح طريقتنا استنتاج تسمية فئة لنص شخصي بهذه الطريقة (1) لا يتعين على مالك النص الشخصي الكشف عن نصها لأي شخص بطريقة غير مشفرة، و (2) مالك النصلا يتعين على المصنف أن يكشف عن المعلمات النموذجية المدربة إلى مالك النص أو أي شخص آخر.لإظهار جدوى بروتوكولنا لتصنيف النص الخاص العملي، نفذناها في Fronten Fresk Framepten المستندة إلى Pytorch، باستخدام مخطط تقاسم سري معروف جيدا في الإعداد الصادق وغير الغريب.نحن نختبر وقت تشغيل مصنف نصي المحفوظ في الخصوصية لدينا، وهو سريع بما يكفي لاستخدامه في الممارسة العملية.
قمنا من خلال هذا البحث بتصميم برنامج يهدف إلى تحديد النقاط الحرجة التي يمكن أن تسبب إنهيار التوتر، و بناء شبكة عصبونية ضمن بيئة برمجيات ماتلاب مهمتها التنبؤ بقيمة الاستطاعة العظمى التي يمكن نقلها على نظام القدرة الكهربائية في ظروف انهيار التوتر دو ن أن ينهار نظام القدرة، و تدريبها على حالات واقعية تعرضت لها أنظمة القدرة الكهربائية، ثم قمنا بتطبيق هذه الشبكة العصبونية المدربة على شبكة مرجعية IEEE-14 Bus-bar لإختبار أدائها و مقارنة النتائج.
يهدف البحث إلى تقديم دراسة مرجعيّة مفصلة عن استخدام الشبكات العصبونية الإلتفافية (CNNs) في استخراج الميزات (Features) من الصور. وسيتطرق البحث إلى التعريف بمعنى الميزات (Features) الخاصة بالصور وأهميتها في تطبيقات معالجة الصورة. وسيتم أيضاً التعريف بالشبكات العصبونية الإلتفافية (CNNs) وبنيتها و طريقة عملها وأنواع المقاربات والمنهجيات المستخدمة في تدريبها لاستخراج الميزات (Features) من الصور.
يقدم هذا البحث منظومة للتعرف على مسميات المخططات الزمنية، حيث يتم استخلاص المسميات من المخططات، التي هي عبارة عن صورة باستخدام التقسيم المكاني من أجل اقتطاع صور المسميات فقط. تُوحد أحجام صور المسميات باستخدام خوارزمية المتوسط لسببين؛ الأول تشكيل قاعد ة البيانات التدريبية للشبكات العصبونية المستخدمة، و ثانياً من أجل اجراء عملية التعرف. تم اعتماد الشبكات العصبونية للتعرف بآليتين مختلفتين: آلية التصنيف classification باستخدام شبكة Perceptron و آلية التمييز باستخدام شبكة الانتشار العكسي، حيث تم بناء شبكة Perceptron دخلها صورة المسمى فتُعطي في خرجها الدليل التصنيفي للمسمى، ليتم معرفته بالاعتماد على جدول مسميات مخزن مسبقاً، و شبكة انتشار عكسي دخلها صورة المسمى و خرجها الترميز الحاسوبي للمسمى، كما تم تصميم شبكة الانتشار العكسي بحيث يمكن لها التعرف على كافة صور مسميات أحرف الأبجدية الانكليزية المستخدمة في المخططات الزمنية، أظهرت نتائج البحث فعالية المنظومة المصممة للتعرف على مسميات المخططات الزمنية من صورها، و ذلك للآليتين التصنيفية و التمييزية، بعد تطبيق النظام على ثلاث مخططات زمنية.

الأسئلة المقترحة

التعليقات
جاري جلب التعليقات جاري جلب التعليقات
سجل دخول لتتمكن من متابعة معايير البحث التي قمت باختيارها
mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا