15 أدوات التنقيب عن البيانات مفتوحة المصدر Pages 21 32,35 41,46 53 Compressed

You might also like

Download as pdf or txt
Download as pdf or txt
You are on page 1of 5

‫أدوات التنقيب عن البيانات مفتوحة املصدر‪ :‬دراسة حتليلية تقييمية‬ ‫‪161‬‬

‫جدول رقم (‪)0‬‬


‫معايير األداء ألدوات التنقيب عن البيانات‬

‫الوصف‬ ‫المعيار‬
‫هل البرنامج يعمل على نظم تشغيل متنوعة؟ وهل يعمل على نظم‬ ‫نظام التشغيل‬
‫تشغيل المستفيدين التجارية النموذجية؟‬
‫هل يستخدم البرنامج تركيب الخادم – العميل؟ أو يستخدم تركيبا‬ ‫تركيب‬
‫وهيكال مستقال؟ وهل يحق للمستفيدين اختيار الهيكل أو التركيب‬ ‫البرنامج‬
‫المرغوب؟‬
‫الوصول إلى ما واجهة البرنامج المطلوبة؟‬
‫البيانات‬
‫حجم البيانات هل البرنامج يتناسب مع مجموعات البيانات الكبيرة؟‬
‫هل يظهر البرنامج نتائج خالل وقت مناسب؟‬ ‫الكفاءة‬
‫هل تتوافق واجهة األداة مع األدوات األخرى أو مجموعة‬ ‫التوافقية‬
‫األدوات؟‬
‫ما درجة تماسك األداة؟ كم عدد المرات التي يتم فيها عطل األداة‬ ‫المتانة‬
‫أو انهيارها؟‬

‫ثانيا‪ :‬معايير الوظيفة‪ :‬تعالج هذه المعايير عوامل مختلفة مثل اإلمكانيات‬
‫والتقنيات والمنهجيات المختلفة‪ ،‬وتخترب هذه العوامل األداة مقابل مشكلة التنقيب‬
‫عن البيانات‪ ،‬لذا يمكن معرفة مدى تأقلم األداة مع الظروف المختلفة‪ ،‬كما يتيح‬
‫اختبار وظائف األداة األساسية مع النظر لمسار تركيب خوارزمية مشكلة التنقيب‬
‫عن البيانات‪.‬‬
‫‪169‬‬ ‫د‪ .‬أمحد فايز أمحد سيد‬

‫جدول رقم (‪)6‬‬


‫معايير الوظيفة ألدوات التنقيب عن البيانات‬

‫الوصف‬ ‫المعيار‬
‫هل يوفر البرنامج مجموعة مختلفة من تقنيات التنقيب‬ ‫التنوع‬
‫والخوارزميات لدعم القرارات؟‬
‫هل يساعد البرنامج المستفيد بتقديم منهجية التنقيب خطوة‬ ‫المنهجية‬
‫بخطوة؟‬
‫هل تدعم األداة نموذج الصالحية باإلضافة إلى إنتاج نموذج؟‬ ‫الصالحية‬
‫هل تطبيق الخوارزميات المدعمة تعالج مجموعة من أنواع‬ ‫نوع البيان‬
‫البيانات؟‬
‫على هل يمكن للمستفيد تعديل وضبط الخوارزميات؟‬ ‫القدرة‬
‫التعديل‬
‫هل يمكن لألداة أخذ عينة عشوائية من البيانات لنموذج التنبؤ؟‬ ‫عينة البيانات‬
‫هل تظهر نتائج تقارير تحليل التنقيب بعدة طرق مختلفة؟‬ ‫التقرير‬
‫هل من الممكن تصدير النموذج لصيغ أخرى من األدوات مثل‬ ‫تصدير‬
‫اكسيل أو اس كيو ال ‪SQL‬‬ ‫النموذج‬

‫ثالثا‪ :‬معايير الدعم‪ :‬تستخدم لتتبع معايير الدعم ومكان مصادر الدعم التي‬
‫يتم قياسها هبذا المعيار‪ ،‬ويستخدم هذا المعيار أيضا لبناء خصائص تساهم يف دعم‬
‫النظام‪ ،‬ومن هذه الخصائص‪ :‬تنظيف البيانات واستبدالها وفلرتهتا وحذفها وغيرها‪.‬‬
‫أدوات التنقيب عن البيانات مفتوحة املصدر‪ :‬دراسة حتليلية تقييمية‬ ‫‪141‬‬

‫جدول رقم (‪)4‬‬


‫معايير الدعم ألدوات التنقيب عن البيانات‬

‫الوصف‬ ‫المعيار‬
‫هل تتيح األداة إمكانية تعديل القيم الخطأ يف مجموعة البيانات‬ ‫تنظيف البيانات‬
‫أو أداء عمليات أخرى مصممة لتنظيف البيانات؟‬
‫هل تتيح األداة التبديل الشامل ألحد قيم البيانات أو مجموعة‬ ‫استبدال البيانات‬
‫من القيم؟‬
‫هل تتيح األداة اختيار المجموعات الفرعية من البيانات بناء‬ ‫فلترة البيانات‬
‫على معايير اختيار المستفيد؟‬
‫هل تتيح األداة عشوائية البيانات طبقا لنموذج البناء؟‬ ‫العشوائية‬
‫هل تتيح األداة حذف كل التسجيالت أو حذف بعض منها؟‬ ‫حذف‬
‫التسجيالت‬
‫معالجة الفراغات هل تعالج األداة الفراغات لتجنب فساد البيانات؟‬
‫معالجة واصفات هل تقدم األداة للمستفيد توصيفات للبيانات وأنواعها؟‬
‫البيانات‬
‫المرتدة هل تتيح األداة باستخراج النتائج من التحليل الداخلي؟‬ ‫التغذية‬
‫الناتجة‬

‫رابعا‪ :‬معايير الستخدام‪ :‬وتستخدم لتتبع معايير االستخدام وسهولة‬


‫االستخدام‪ ،‬ويتم استخدام هذه المعايير لبناء صفات تساهم يف استخدام النظام‪،‬‬
‫وتتضمن هذه الصفات منحنى تعلم واجهة المستفيد‪ ،‬أنواع المستفيدين‪ ،‬عرض‬
‫البيانات وغيرها‪.‬‬
‫‪140‬‬ ‫د‪ .‬أمحد فايز أمحد سيد‬

‫جدول رقم (‪)3‬‬


‫معايير الستخدام ألدوات التنقيب عن البيانات‬

‫الوصف‬ ‫المعيار‬
‫هل تقدم الواجهة النتائج بطريقة مفهومة وواضحة؟‬ ‫واجهة المستفيد‬
‫هل األداة سهل تعلمها؟‬ ‫منحنى التعلم‬
‫هل األداة مصممة للمبتدئين والمتوسطين والمتقدمين من‬ ‫أنواع المستفيدين‬
‫المستفيدين أو دمج بين أنواع المستفيدين؟‬
‫هل األداة تمثل البيانات؟‬ ‫رؤية البيانات وعرضها‬
‫هل تم اإلعالن عن الخطأ بطريقة مفهومة وواضحة؟‬ ‫تقارير الخطأ‬
‫هل تحتفظ األداة بتاريخ األفعال التي تم اتخاذها يف عملية‬ ‫تاريخ العمل‬
‫التنقيب؟‬
‫هل يمكن لألداة أن تستخدم يف مجموعة من التطبيقات‬ ‫تنوع النطاق‬
‫والصناعات لحل المشكالت المختلفة‬

‫والجدير بالذكر أن هناك العديد من الباحثين والمنظمات الذين قاموا‬


‫بمراجعة أدوات التنقيب عن البيانات وبعمليات مسحية حول منقبي البيانات‪،‬‬
‫وأنتجت هذه الدارسات مجموعة من حزم الربمجيات التي لها مزاياها وعيوهبا‪،‬‬
‫وهذه الدارسات تقع ما بين عام ‪1777‬م – ‪4811‬م(‪ )1‬ومن خالل هذه الدراسات تم‬

‫‪(1) Mikut, R., Reischl, M. (September–October 2011). Data Mining‬‬


‫‪Tools. Wiley Interdisciplinary Reviews: Data Mining and Knowledge‬‬
‫‪Discovery 1 (5):‬‬ ‫‪431–445.‬‬ ‫‪Available‬‬ ‫‪at:‬‬
‫‪http://onlinelibrary.wiley.com/doi/10.1002/widm.24/pdf‬‬
‫‪ Rexer, K., Allen, H. and Gearan, P. (2011). Understanding Data Miners.‬‬
‫=‬
‫أدوات التنقيب عن البيانات مفتوحة املصدر‪ :‬دراسة حتليلية تقييمية‬ ‫‪142‬‬

‫ويتضح من الجدول السابق ما يلي‪:‬‬

‫‪ .1‬تشابه موقع الدول المنتجة لهذه الربامج وهي قارة أوربا فيما عدا ‪Rattle‬‬
‫بأسرتاليا و‪ Weka‬بنيوزلندا‪.‬‬
‫‪ .4‬تستخدم األدوات لغة واحدة للعرض فيما عدا ‪ Orange‬تستخدم لغتين‪،‬‬
‫كما تتشابه ثالث أدوات يف استخدام لغة الجافا وهم‪،Weka ،RapidMiner :‬‬
‫‪.KNIME‬‬
‫‪ .8‬بما أن أدوات الدراسة مفتوحة المصدر‪ ،‬لذا فهي تستخدم رخصة الربامج‬
‫مفتوحة المصدر والرخصة المجانية‪ ،‬كما أن تحميلهم بالمجان‪.‬‬
‫‪ .2‬تدعم معظم األدوات العديد من نظم التشغيل مثل لينكس وماك‬
‫والويندوز فيما عدا تانجرا ‪.Tangra‬‬
‫ثانيا‪ :‬مصدر البيانات (برامج قواعد البيانات)‪ :‬عادة تتوافر تطبيقات البيانات‬
‫من مصادر مختلفة وبصيغ متنوعة‪ ،‬وتعد إمكانية الوصول لصيغ هذه البيانات من‬
‫األهمية بما كان يف اختيار نظام المصدر المفتوح‪ ،‬لذا يوضح الجدول التالي مصادر‬
‫بيانات التي تميز النظم التي يمكن الوصول إليها وإلى مصادر البيانات الخاصة هبا‪،‬‬
‫ويرتبط بذلك حجم البيانات لسهولة التعامل مع النظام أو األداة‪.‬‬
‫جدول رقم (‪)2‬‬
‫مقارنة بين مصادر بيانات أدوات التنقيب عن البيانات مفتوحة المصدر‬
‫‪TANAGRA ‍KNIME‬‬ ‫‪‍Rattle‬‬ ‫‪‍Orange‬‬ ‫‪‍Weka ‍RapidMiner‬‬ ‫م‍ المعيار‍‬
‫×‬ ‫×‬ ‫×‬ ‫×‬ ‫×‍‬ ‫‍‬ ‫‪‬‬ ‫‪‍ Oracle .1‬‬
‫×‬ ‫×‬ ‫×‬ ‫×‬ ‫×‬ ‫‍‬ ‫‪‬‬ ‫‪‍ Sybase .2‬‬
‫×‬ ‫×‬ ‫×‬ ‫×‬ ‫×‬ ‫‍‬ ‫‪‬‬ ‫‪SQLSer .3‬‬
‫‪‍v‬‬
‫×‬ ‫‪‬‬ ‫‪‬‬ ‫‪‬‬ ‫×‬ ‫‪‬‬ ‫‪‍ MySQL .4‬‬

You might also like