Download as pdf or txt
Download as pdf or txt
You are on page 1of 5

‫أدوات التنقيب عن البيانات مفتوحة املصدر‪ :‬دراسة حتليلية تقييمية‬ ‫‪161‬‬

‫جدول رقم (‪)0‬‬


‫معايير األداء ألدوات التنقيب عن البيانات‬

‫الوصف‬ ‫المعيار‬
‫هل البرنامج يعمل على نظم تشغيل متنوعة؟ وهل يعمل على نظم‬ ‫نظام التشغيل‬
‫تشغيل المستفيدين التجارية النموذجية؟‬
‫هل يستخدم البرنامج تركيب الخادم – العميل؟ أو يستخدم تركيبا‬ ‫تركيب‬
‫وهيكال مستقال؟ وهل يحق للمستفيدين اختيار الهيكل أو التركيب‬ ‫البرنامج‬
‫المرغوب؟‬
‫الوصول إلى ما واجهة البرنامج المطلوبة؟‬
‫البيانات‬
‫حجم البيانات هل البرنامج يتناسب مع مجموعات البيانات الكبيرة؟‬
‫هل يظهر البرنامج نتائج خالل وقت مناسب؟‬ ‫الكفاءة‬
‫هل تتوافق واجهة األداة مع األدوات األخرى أو مجموعة‬ ‫التوافقية‬
‫األدوات؟‬
‫ما درجة تماسك األداة؟ كم عدد المرات التي يتم فيها عطل األداة‬ ‫المتانة‬
‫أو انهيارها؟‬

‫ثانيا‪ :‬معايير الوظيفة‪ :‬تعالج هذه المعايير عوامل مختلفة مثل اإلمكانيات‬
‫والتقنيات والمنهجيات المختلفة‪ ،‬وتخترب هذه العوامل األداة مقابل مشكلة التنقيب‬
‫عن البيانات‪ ،‬لذا يمكن معرفة مدى تأقلم األداة مع الظروف المختلفة‪ ،‬كما يتيح‬
‫اختبار وظائف األداة األساسية مع النظر لمسار تركيب خوارزمية مشكلة التنقيب‬
‫عن البيانات‪.‬‬
‫‪169‬‬ ‫د‪ .‬أمحد فايز أمحد سيد‬

‫جدول رقم (‪)6‬‬


‫معايير الوظيفة ألدوات التنقيب عن البيانات‬

‫الوصف‬ ‫المعيار‬
‫هل يوفر البرنامج مجموعة مختلفة من تقنيات التنقيب‬ ‫التنوع‬
‫والخوارزميات لدعم القرارات؟‬
‫هل يساعد البرنامج المستفيد بتقديم منهجية التنقيب خطوة‬ ‫المنهجية‬
‫بخطوة؟‬
‫هل تدعم األداة نموذج الصالحية باإلضافة إلى إنتاج نموذج؟‬ ‫الصالحية‬
‫هل تطبيق الخوارزميات المدعمة تعالج مجموعة من أنواع‬ ‫نوع البيان‬
‫البيانات؟‬
‫على هل يمكن للمستفيد تعديل وضبط الخوارزميات؟‬ ‫القدرة‬
‫التعديل‬
‫هل يمكن لألداة أخذ عينة عشوائية من البيانات لنموذج التنبؤ؟‬ ‫عينة البيانات‬
‫هل تظهر نتائج تقارير تحليل التنقيب بعدة طرق مختلفة؟‬ ‫التقرير‬
‫هل من الممكن تصدير النموذج لصيغ أخرى من األدوات مثل‬ ‫تصدير‬
‫اكسيل أو اس كيو ال ‪SQL‬‬ ‫النموذج‬

‫ثالثا‪ :‬معايير الدعم‪ :‬تستخدم لتتبع معايير الدعم ومكان مصادر الدعم التي‬
‫يتم قياسها هبذا المعيار‪ ،‬ويستخدم هذا المعيار أيضا لبناء خصائص تساهم يف دعم‬
‫النظام‪ ،‬ومن هذه الخصائص‪ :‬تنظيف البيانات واستبدالها وفلرتهتا وحذفها وغيرها‪.‬‬
‫أدوات التنقيب عن البيانات مفتوحة املصدر‪ :‬دراسة حتليلية تقييمية‬ ‫‪141‬‬

‫جدول رقم (‪)4‬‬


‫معايير الدعم ألدوات التنقيب عن البيانات‬

‫الوصف‬ ‫المعيار‬
‫هل تتيح األداة إمكانية تعديل القيم الخطأ يف مجموعة البيانات‬ ‫تنظيف البيانات‬
‫أو أداء عمليات أخرى مصممة لتنظيف البيانات؟‬
‫هل تتيح األداة التبديل الشامل ألحد قيم البيانات أو مجموعة‬ ‫استبدال البيانات‬
‫من القيم؟‬
‫هل تتيح األداة اختيار المجموعات الفرعية من البيانات بناء‬ ‫فلترة البيانات‬
‫على معايير اختيار المستفيد؟‬
‫هل تتيح األداة عشوائية البيانات طبقا لنموذج البناء؟‬ ‫العشوائية‬
‫هل تتيح األداة حذف كل التسجيالت أو حذف بعض منها؟‬ ‫حذف‬
‫التسجيالت‬
‫معالجة الفراغات هل تعالج األداة الفراغات لتجنب فساد البيانات؟‬
‫معالجة واصفات هل تقدم األداة للمستفيد توصيفات للبيانات وأنواعها؟‬
‫البيانات‬
‫المرتدة هل تتيح األداة باستخراج النتائج من التحليل الداخلي؟‬ ‫التغذية‬
‫الناتجة‬

‫رابعا‪ :‬معايير الستخدام‪ :‬وتستخدم لتتبع معايير االستخدام وسهولة‬


‫االستخدام‪ ،‬ويتم استخدام هذه المعايير لبناء صفات تساهم يف استخدام النظام‪،‬‬
‫وتتضمن هذه الصفات منحنى تعلم واجهة المستفيد‪ ،‬أنواع المستفيدين‪ ،‬عرض‬
‫البيانات وغيرها‪.‬‬
‫‪140‬‬ ‫د‪ .‬أمحد فايز أمحد سيد‬

‫جدول رقم (‪)3‬‬


‫معايير الستخدام ألدوات التنقيب عن البيانات‬

‫الوصف‬ ‫المعيار‬
‫هل تقدم الواجهة النتائج بطريقة مفهومة وواضحة؟‬ ‫واجهة المستفيد‬
‫هل األداة سهل تعلمها؟‬ ‫منحنى التعلم‬
‫هل األداة مصممة للمبتدئين والمتوسطين والمتقدمين من‬ ‫أنواع المستفيدين‬
‫المستفيدين أو دمج بين أنواع المستفيدين؟‬
‫هل األداة تمثل البيانات؟‬ ‫رؤية البيانات وعرضها‬
‫هل تم اإلعالن عن الخطأ بطريقة مفهومة وواضحة؟‬ ‫تقارير الخطأ‬
‫هل تحتفظ األداة بتاريخ األفعال التي تم اتخاذها يف عملية‬ ‫تاريخ العمل‬
‫التنقيب؟‬
‫هل يمكن لألداة أن تستخدم يف مجموعة من التطبيقات‬ ‫تنوع النطاق‬
‫والصناعات لحل المشكالت المختلفة‬

‫والجدير بالذكر أن هناك العديد من الباحثين والمنظمات الذين قاموا‬


‫بمراجعة أدوات التنقيب عن البيانات وبعمليات مسحية حول منقبي البيانات‪،‬‬
‫وأنتجت هذه الدارسات مجموعة من حزم الربمجيات التي لها مزاياها وعيوهبا‪،‬‬
‫وهذه الدارسات تقع ما بين عام ‪1777‬م – ‪4811‬م(‪ )1‬ومن خالل هذه الدراسات تم‬

‫‪(1) Mikut, R., Reischl, M. (September–October 2011). Data Mining‬‬


‫‪Tools. Wiley Interdisciplinary Reviews: Data Mining and Knowledge‬‬
‫‪Discovery 1 (5):‬‬ ‫‪431–445.‬‬ ‫‪Available‬‬ ‫‪at:‬‬
‫‪http://onlinelibrary.wiley.com/doi/10.1002/widm.24/pdf‬‬
‫‪ Rexer, K., Allen, H. and Gearan, P. (2011). Understanding Data Miners.‬‬
‫=‬
‫أدوات التنقيب عن البيانات مفتوحة املصدر‪ :‬دراسة حتليلية تقييمية‬ ‫‪142‬‬

‫ويتضح من الجدول السابق ما يلي‪:‬‬

‫‪ .1‬تشابه موقع الدول المنتجة لهذه الربامج وهي قارة أوربا فيما عدا ‪Rattle‬‬
‫بأسرتاليا و‪ Weka‬بنيوزلندا‪.‬‬
‫‪ .4‬تستخدم األدوات لغة واحدة للعرض فيما عدا ‪ Orange‬تستخدم لغتين‪،‬‬
‫كما تتشابه ثالث أدوات يف استخدام لغة الجافا وهم‪،Weka ،RapidMiner :‬‬
‫‪.KNIME‬‬
‫‪ .8‬بما أن أدوات الدراسة مفتوحة المصدر‪ ،‬لذا فهي تستخدم رخصة الربامج‬
‫مفتوحة المصدر والرخصة المجانية‪ ،‬كما أن تحميلهم بالمجان‪.‬‬
‫‪ .2‬تدعم معظم األدوات العديد من نظم التشغيل مثل لينكس وماك‬
‫والويندوز فيما عدا تانجرا ‪.Tangra‬‬
‫ثانيا‪ :‬مصدر البيانات (برامج قواعد البيانات)‪ :‬عادة تتوافر تطبيقات البيانات‬
‫من مصادر مختلفة وبصيغ متنوعة‪ ،‬وتعد إمكانية الوصول لصيغ هذه البيانات من‬
‫األهمية بما كان يف اختيار نظام المصدر المفتوح‪ ،‬لذا يوضح الجدول التالي مصادر‬
‫بيانات التي تميز النظم التي يمكن الوصول إليها وإلى مصادر البيانات الخاصة هبا‪،‬‬
‫ويرتبط بذلك حجم البيانات لسهولة التعامل مع النظام أو األداة‪.‬‬
‫جدول رقم (‪)2‬‬
‫مقارنة بين مصادر بيانات أدوات التنقيب عن البيانات مفتوحة المصدر‬
‫‪TANAGRA ‍KNIME‬‬ ‫‪‍Rattle‬‬ ‫‪‍Orange‬‬ ‫‪‍Weka ‍RapidMiner‬‬ ‫م‍ المعيار‍‬
‫×‬ ‫×‬ ‫×‬ ‫×‬ ‫×‍‬ ‫‍‬ ‫‪‬‬ ‫‪‍ Oracle .1‬‬
‫×‬ ‫×‬ ‫×‬ ‫×‬ ‫×‬ ‫‍‬ ‫‪‬‬ ‫‪‍ Sybase .2‬‬
‫×‬ ‫×‬ ‫×‬ ‫×‬ ‫×‬ ‫‍‬ ‫‪‬‬ ‫‪SQLSer .3‬‬
‫‪‍v‬‬
‫×‬ ‫‪‬‬ ‫‪‬‬ ‫‪‬‬ ‫×‬ ‫‪‬‬ ‫‪‍ MySQL .4‬‬

You might also like