Professional Documents
Culture Documents
ملخص
ملخص
في اآلونة األخيرة ،جذب التنبؤ المبكر بعيوب البرمجيات باستخدام تقنيات التعلم اآللي مزي ًدا من اهتمام الب!!احثين نظ!!رً ا ألهميت!!ه في إنت!!اج
برامج ناجحة .من ناحية أخرى ،فإنه يقلل من تكلفة تطوير البرمجيات ويسهل اإلجراءات ويتنبأ بالنسب المئوية للبرامج المعرضة للعيوب
في المستقبل .ال يوجد دليل قاطع على أنواع معينة من التعلم اآللي ستكون أكثر كفاءة ودقة للتنبؤ بعي!وب ال!برامج .وم!ع ذل!ك ،ف!إن بعض
األبحاث السابقة ذات الصلة تقترح تقنيات Ensemble Learningكبديل أكثر دقة .يقدم ه!!ذا البحث تقني!!ة Ensemble Learningم!!ع
ثالثة أنواع من متعلمي المجموعات ،Boosting، Bagging and Rotation Forestباستخدام ثماني!!ة من ،base learnersقد تم
اختبارهم على سبعة أنواع من مجموعات البيانات المعيارية المتوفرة في مستودع PROMISE .وفى ضوء البحث تشير النت!!ائج إلى أن!!ه
ق!!د تم تحس!!ين الدق!!ة باس!!تخدام تقني!!ات Ensemble Learningأك!!ثر من اس!!تخدام تقني!!ات single leanersخاص! ً
!ة ب!!التزامن م!!ع
Rotation Forestوكذلك resample techniquesوذلك في معظم الخوارزميات المستخدمة في النتائج التجريبية.
نتيجة االستثمار الهائل والتكلفة العالية التي يتم إنفاقها في تطوير هندسة البرمجيات في زي!!ادة تكلف!!ة ص!!يانة ه!!ذه األنظم!!ة .ح!!ديثا ،أص!!بح
الحجم الضخم للبرنامج المطورة أكثر تعقي ًد ا .باإلضافة الى انه لدينا حجم كبير من أكواد البرامج .لذلك فق!!د زادت احتمالي!!ة وج!!ود عي!!وب
في البرامج ولم تعد طرق ضمان الجودة كافية للتغلب على جميع عيوب البرامج في األنظمة الضخمة .لذلك ،إذا تمكنا من تحديد الوحدات
النمطية في البرامج التي من المحتمل أن تكون معيب!!ة ،فيمكن أن تس!!اعدنا في تقلي!!ل مواردن!!ا المح!!دودة من الم!!برمجين وقت التط!!وير .تم
اقتراح عدد من النماذج التنبؤية في هذا البحث للتنبؤ بالعيوب في وحدات البرامج باستخدام عدة أنواع من اللوغاريتم!!ات مث!!ل Decision
., Tree ,SVM ANN, Naïve Bayesويجدر اإلحاطة بوجود فئتين من عيوب البرامج :برنامج ) Fault-Prone (FPوبرنامج Non-
) .Prone-Prone (NFPواله!!دف من بحثن!!ا ه!!و االس!!تفادة من طريق!!ة Ensemble Learningلتحس!!ين دق!!ة النم!!وذج التنب!!ئي بعي!!وب
البرمجيات .ميزة أخرى في ه!ذا البحث وه!و هي تحس!ين األداء باس!تخدام أن!واع مختلف!ة من classifiersمعً! ا ألن ه!ذا يقل!ل من التب!اين
varianceبينه!!ا ويحاف!!ظ على مع!!دل خط!!أ التح!!يز دون زي!!ادة .يتم اس!!تخدام ثالث!!ة أن!!واع من Ensemble Learning: Bagging,
.Boosting and Rotation Forest techniquesتعتمد تقنية technique Baggingعلى أخذ عينات فرعية من مجموعة بيانات
التدريب عن طريق replacing samplesوعمل دمج combiningلمجموعات فرعية للتدريب ،ثم دمج نتائج classifiersبن!!ا ًء على
تقنية .Voting technique
يعتمد البحث على استخدام اختبار تصنيف موقع Wilcoxonكاختبار non-parametric significance testالستخدامه للمقارنة بين
اثنين من learnersوباستخدام .Significance testخال ًفا لذلك ،إذا احتجنا إلى مقارنة the multiple learners over multiple
،datasetsفإن اختبار Fireman testموصى به من خالل اختبار .Nemenyi Post-hoc
في هذه الورقة البحثية ،قمنا بتحليل دقة وأداء ثالث طرق من Ensemble Learningوهم Bagging, Boosting and Rotation
Forestبنا ًء على 8قواعد base learnersللتنبؤ بعيوب البرنامج والنتائج كانت على النحو التالي:
أصغر حجمًا في أك!!ثر من 7عين!ات من مجموع!!ات البيان!!ات باس!!تخدام تقني!!ة resample single leaners ( )1تم تحسين دقة معظم
.technique as preprocessing step
( )2نتيجة للبحث ،ال ينصح باستخدام SVM , Logistic , SVMكمتعلم واحد single learnerمع resample methodsلكال من
,Boosting, Bagging , Rotation Forest
( )3يتم الحصول على الدقة واألداء باستخدام Baggingمع base learnerلكال من ,MLP PARTمع ، Boostingيتم اكتساب دقة
األداء لـ PART , Random Forest , Naïve Bayesبينما يتم اكتساب Rotation Forestمع base learners 4في أداء مثل
.PART , J48 , MLP , Random Forest
( )4يتم فقدان دقة نتائج األداء باستخدام SVMمع ثالث طرق تجميع متجانسة ،مع ، Rotation Forestال توجد دق!!ة ،خس!!ائر في
األداء إال باستخدام .SVMوبالت!!الي ،مع ، Rotation Forestال توج!!د خس!!ائر في الدق!!ة واألداء إال باس!!تخدام .SVMوبالت!!الي ،ف!!إن
Rotation Forestهي أفضل طريقة ينصح بها الباحثون لالستخدام ه!!ذه الدراس!!ة البحثي!!ة لميزته!!ا في الق!!درة على generalization
.abilityفي العمل المستقبلي ،سنختبر المزيد من خوارزميات المجموع!!ات باس!!تخدام مص!!نف أساس!!ي مختل!!ف على المزي!!د من ال!!برامج
ومجموعات البيانات وسنختبر أكثر من تقنيه من تقنيات المعالجة المسبقة preprocessing techniquesلتحسين النتائج.