ترغب بنشر مسار تعليمي؟ اضغط هنا


اﻹجابات ( 1 )

Ahmad Ali

ان اختيار الوسيلة المناسبة يعتمد على طبيعة البيانات تحت الدراسة وعلى حجمها يمكن اجراء عملية التنقيب في البيانات بالمقارنة مع سوق البيانات ومخزن البيانات.

أهم طرق تنقيب البيانات

  1. قاعدة الارتباط Association Rule : أنها عملية استكشاف وتحليل كميات كبيرة من البيانات باستخدام أساليب ألية او شبه ألية اعتمادا على اكتشاف نماذج وقواعد ذات مغزى.
  • التصنيف Classification : تحليل مجموعة من البيانات ووضعها على شكل أصناف وأقسام, وهناك عدد من الطرق التي يمكن استخدامها في تصنيف البيانات باستخدام الخوارزميات.
  • العنقدة Clustering: جمع البيانات هي عملية وضع البيانات في تجمعات مشابهة، وهي أحد فروع التنقيب عن البيانات. تقسم خوارزمية التجميع مجموعة بيانات إلى عدة تجمعات، حيث أن التشابه بين النقاط ضمن تجمع معين أكبر من التشابه بين نقطتين ضمن تجمعين مختلفين. فكرة تجميع البيانات بسيطة في طبيعتها وقريبة جدا من الإنسان في طريقة تفكيره حيث أننا كلما تعاملنا مع كمية كبيرة من البيانات نميل إلى تلخيص الكم الهائل من البيانات إلى عدد قليل من المجموعات أو الفئات وذلك من أجل تسهيل عملية التحليل.

تستخدم خوارزميات التجميع على نطاق واسع وليس فقط لتنظيم وتصنيف البيانات ولكن لضغط البيانات وبناء نموذج ترتيب البيانات، حيث أنه اذا كان بأمكاننا ان نجد تجمعات من البيانات فانه بالامكان بناء نموذج للمشكلة على اساس تلك التجمعات.

العنقدة هي أيضا عملية تقسيم البيانات إلى مجموعة من الأصناف اعتمادا على اشتراكها بالخواص المتشابهة وان العنتقدة هي تقسيم غير موجه للبيانات. وهي عكس التصنيف كما انها تساعد المستفيد على فهم التركيب الطبيعي للمجموعات من البيانات.

اما الطريقة الثانية فهي عملية العنقدة الجزئية وهي من اهم طرق العنقدة وهذه الطريقة تفترض ان كل العناصر الموجودة عبارة عن مجموعة واحدة ومن ثم تختار عنصرين بصورة عشوائية وترى قياس التشابه بين العنصرين واكبر العناصر تشابها هي التي تنقسم وهكذا تتوالي الانقسامات الى ان تصل لعدد الانقسامات المطلوبة واشهر أمثلتها هي خوارزمية K Means



الاسئلة المقترحة

mircosoft-partner

هل ترغب بارسال اشعارات عن اخر التحديثات في شمرا-اكاديميا