1106 اسلامی

‫ﺗﺄﺛﯿﺮ ﻣﺘﺮﯾﮏﻫﺎي ﻃﺮاﺣﯽ ﻧﺴﺒﺖ ﺑﻪ ﻣﺘﺮﯾﮏ ﻫﺎي ﮐﺪ در ﺑﻬﺒﻮد ﮐﺎراﯾﯽ‬
‫ﺳﺎﻣﺎﻧﻪﻫﺎي ﺗﺴﺖ اﺗﻮﻣﺎﺗﯿﮏ‬

‫زﻫﺮا اﺳﻼﻣﯽ ﻣﺸﮑﻨﺎﻧﯽ‪ ،‬اﺷﮑﺎن ﺳﺎﻣﯽ‪ ،‬اﺣﻤﺪ ﻓﺮاﻫﯽ‬
‫در ﯾﮏ دﻗﯿﻘﻪ‪ 1‬ﺑﺎزرﺳﯽ ﮐﻨﺪ واﺿﺢ اﺳﺖ ﮐﻪ ﭼﺮا ﭘﯿﺸﮕﻮﯾﯽﻫﺎي اﺗﻮﻣﺎﺗﯿﮏ ﺧﻄﺎ‬ ‫ﭼﮑﯿﺪه‪ -‬ﭘﯿﺸﮕﻮﯾﯽ اﺗﻮﻣﺎﺗﯿﮏ ﺧﻄﺎ ﺑﺮ اﺳﺎس ﻣﺘﺮﯾﮏ ﻫﺎي ﻣﻮﺟﻮد در ﭘﺮوژه ﯾﮑﯽ از‬
‫ﻣﺒﺎﺣﺚ ﻣﻮرد ﺗﻮﺟﻪ ﺑﺮاي اﻓﺰاﯾﺶ ﮐﯿﻔﯿﺖ ﻧﺮم اﻓﺰار اﺳﺖ‪ .‬ﺑﺎ وﺟﻮد اﺳﺘﻔﺎده زﯾﺎد از‬
‫ﺑﺮ اﺳﺎس ﻣﺘﺮﯾﮏ ﻫﺎي ﻣﻮﺟﻮد در ﭘﺮوژه‪ ،‬اﯾﻦ ﭼﻨﯿﻦ ﻣﻮرد ﺗﻮﺟﻪ ﺗﻮﻟﯿﺪ ﮐﻨﻨﺪﮔﺎن‬
‫ﻣﺘﺮﯾﮏ ﻫﺎي ﮐﺪ در ﻣﻄﺎﻟﻌﺎت ﮔﺬﺷﺘﻪ‪ ،‬ﺗﻨﻬﺎ ﺳﻪ ﻣﻄﺎﻟﻌﻪ دﯾﺪه ﺷﺪه ﮐﻪ ﺗﺎﺛﯿﺮ ﻣﺘﺮﯾﮏﻫﺎي‬
‫ﻧﺮم اﻓﺰار اﺳﺖ‪ .‬از اﯾﻨﺮو ﻣﻬﻨﺪﺳﯿﻦ ﻧﺮم اﻓﺰار ﺑﻪ ﺳﺎﺧﺖ ﺳﺎﻣﺎﻧﻪ ﻫﺎﯾﯽ رو آوردﻧﺪ‬
‫ﮐﺪ و ﻣﺘﺮﯾﮏ ﻫﺎي ﻃﺮاﺣﯽ را در ﭘﯿﺸﮕﻮﯾﯽ ﺧﻄﺎي ﻧﺮم اﻓﺰار ﻣﻘﺎﯾﺴﻪ ﻣﯽﮐﻨﺪ و ﻧﺘﺎﯾﺞ‬
‫ﮐﻪ ﺑﺮ اﺳﺎس روش ﻫﺎي داده ﮐﺎوي‪ ،‬ﻓﺎﯾﻞ ﻫﺎي ﻣﺸﮑﻮك را ﺷﻨﺎﺳﺎﯾﯽ ﻣﯽ‬ ‫ﻣﺘﻨﺎﻗﻀﯽ ﻫﻢ دارﻧﺪ‪ .‬در اﯾﻦ ﻣﻄﺎﻟﻌﻪ ﺑﻪ ﻣﻨﻈﻮر درك ﺑﻬﺘﺮ و واﻗﻊ ﺑﯿﻨﺎﻧﻪ ﺗﺮ ﺗﺄﺛﯿﺮ‬
‫ﮐﻨﻨﺪ و در ﻧﺘﯿﺠﻪ ﺑﺎﻋﺚ ﺑﺎﻻ رﻓﺘﻦ ﮐﯿﻔﯿﺖ ﻧﺮم اﻓﺰار‪ ،‬رﺿﺎﯾﺖ ﻣﺸﺘﺮي و ﮐﺎﻫﺶ‬ ‫ﻣﺘﺮﯾﮏﻫﺎي ﻃﺮاﺣﯽ ﻧﺴﺒﺖ ﺑﻪ ﻣﺘﺮﯾﮏ ﻫﺎي ﮐﺪ‪ ،‬از آزﻣﺎﯾﺸﺎت ﻣﺘﻨﻮع ﺗﺮي اﺳﺘﻔﺎده ﺷﺪه‬
‫ﻫﺰﯾﻨﻪ ﻣﯽ ﺷﻮد‪ .‬اوﻟﯿﻦ ﮐﺎر داده ﮐﺎوي ﺗﻮﺳﻂ ﺳﻠﺒﯽ و ﭘﻮرﺗﺮ ]‪ [5‬ﺑﺮ اﺳﺎس‬ ‫اﺳﺖ‪ .‬ﺑﻪ وﺳﯿﻠﻪ ﭼﻨﺪ ﺗﮑﻨﯿﮏ ﻣﺪل ﺳﺎزي‪ ،‬ﻣﺪلﻫﺎي ﭘﯿﺸﮕﻮﯾﯽ ﺧﻄﺎ ﻣﺒﺘﻨﯽ ﺑﺮ ﻣﺘﺮﯾﮏ ﮐﺪ‬
‫و ﻣﺘﺮﯾﮏ ﻃﺮاﺣﯽ و ﺗﺮﮐﯿﺐ آن دو ﺑﺮاي ﺷﻨﺎﺳﺎﯾﯽ ﻣﺎژولﻫﺎي داراي ﺧﻄﺎ ﺳﺎﺧﺘﻪ ﺷﺪه‬
‫ﻣﺘﺮﯾﮏ ﻫﺎي ﮐﺪ ﺑﻮده اﺳﺖ و ﭘﺲ از آن ﻧﯿﺰ ﺑﻪ ﻣﺘﺮﯾﮏ ﻫﺎي ﮐﺪ ﺗﻮﺟﻪ زﯾﺎدي‬
‫اﺳﺖ و ﮐﺎراﯾﯽ دﺳﺘﻪ ﺑﻨﺪي ﻫﺎي ﻣﺨﺘﻠﻒ را ﺑﺎ اﻧﺪازه ﮔﯿﺮي ﺳﻄﺢ زﯾﺮ ﻣﻨﺤﻨﯽ و ﻣﻌﯿﺎر ‪F‬‬
‫ﺷﺪه اﺳﺖ وﻟﯽ ﭼﻮن ﻣﺘﺮﯾﮏ ﻫﺎي ﻃﺮاﺣﯽ در ﻣﻘﺎﯾﺴﻪ ﺑﺎ ﻣﺘﺮﯾﮏ ﻫﺎي ﮐﺪ‬ ‫آن ﻫﺎ ارزﯾﺎﺑﯽ ﻣﯽ ﮐﻨﯿﻢ‪ .‬ﺑﺮ اﺳﺎس ﺗﺴﺖﻫﺎي آﻣﺎري‪ ،‬درﮐﺎراﯾﯽ ﻣﺪلﻫﺎﯾﯽ ﮐﻪ از ﺗﺮﮐﯿﺐ‬
‫ﻣﻤﮑﻦ اﺳﺖ ﺑﻪ روز ﻧﺒﺎﺷﻨﺪ ﺑﻨﺎﺑﺮاﯾﻦ دﻗﺖ ﻣﺘﺮﯾﮏ ﻫﺎي ﮐﺪ را در ﻧﺮم اﻓﺰار‬ ‫ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ و ﻃﺮاﺣﯽ اﺳﺘﻔﺎده ﻣﯽﮐﻨﻨﺪ در ﻣﻘﺎﯾﺴﻪ ﺑﺎ آنﻫﺎﯾﯽ ﮐﻪ از ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ‬
‫ﻧﺪارﻧﺪ‪ .‬ﺗﻨﻬﺎ در ﺳﻪ ﻣﻄﺎﻟﻌﻪ ﮐﺎراﯾﯽ ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ و ﻣﺘﺮﯾﮏ ﻫﺎي ﻃﺮاﺣﯽ و‬ ‫اﺳﺘﻔﺎده ﻣﯽﮐﻨﻨﺪ ﭘﯿﺸﺮﻓﺖ ﻗﺎﺑﻞ ﺗﻮﺟﻬﯽ وﺟﻮد ﻧﺪارد‪ ،‬ﻫﻤﭽﻨﯿﻦ ﻣﺘﺮﯾﮏﻫﺎي ﻃﺮاﺣﯽ‬
‫ﻧﺴﺒﺖ ﺑﻪ ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ و ﯾﺎ ﺗﺮﮐﯿﺐ ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ و ﻃﺮاﺣﯽ ﺗﺄﺛﯿﺮ ﮐﻤﺘﺮي در‬
‫ﺗﺮﮐﯿﺐ آن دو در ﭘﯿﺸﮕﻮﯾﯽ ﺧﻄﺎي ﻧﺮم اﻓﺰار ﻣﻘﺎﯾﺴﻪ ﺷﺪه و ﻧﺘﺎﯾﺞ ﺑﻪ دﺳﺖ‬
‫ﺷﻨﺎﺳﺎﯾﯽ ﻣﺎژول ﻫﺎي داراي ﺧﻄﺎ دارد‪.‬‬
‫آﻣﺪه از آﻧﻬﺎ ﻫﻢ ﻣﺘﻨﺎﻗﺾ اﺳﺖ]‪ 6‬و ‪ 7‬و ‪ . [8‬در ﻧﺘﺎﯾﺞ اوﻟﯿﻦ ﻣﻄﺎﻟﻌﻪ ﻣﺸﺎﻫﺪه‬
‫ﺷﺪه ﮐﻪ ﻣﺪل ﭘﯿﺸﮕﻮﯾﯽ ﮐﻪ از ﻣﺘﺮﯾﮏﻫﺎي ﻃﺮاﺣﯽ اﺳﺘﻔﺎده ﻣﯽﮐﻨﺪ ﺑﻪ ﺧﻮﺑﯽ‬ ‫ﮐﻠﯿﺪ واژه ‪ :‬ﻣﺘﺮﯾﮏ ﻃﺮاﺣﯽ‪ ،‬ﻣﺘﺮﯾﮏ ﮐﺪ‪ ،‬ﭘﯿﺸﮕﻮﯾﯽ ﺧﻄﺎ‪ ،‬داده ﮐﺎوي‬
‫ﻣﺪﻟﯽ اﺳﺖ ﮐﻪ از ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ اﺳﺘﻔﺎده ﻣﯽﮐﻨﺪ و ﭘﯿﺸﺮﻓﺖ ﻣﻬﻤﯽ وﺟﻮد‬

‫‪ -1‬ﻣﻘﺪﻣﻪ‬
‫ﻧﺪارد ﻣﻮﻗﻌﯽ ﮐﻪ ﻣﺘﺮﯾﮏﻫﺎي ﻃﺮاﺣﯽ و ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ ﺗﺮﮐﯿﺐ ﻣﯽﺷﻮﻧﺪ و ﺑﺎ‬
‫ﺧﻄﺎﻫﺎ و ﻧﻘﺺﻫﺎ در ﻧﺮم اﻓﺰار‪ ،‬ﻫﺰﯾﻨﻪ ﺑﺮ ﻫﺴﺘﻨﺪ ]‪ 1‬و ‪ [2‬ﭼﻮن ﺷﻨﺎﺳﺎﯾﯽ و‬
‫ﻫﻢ ﺑﻪ ﻋﻨﻮان ﭘﯿﺸﮕﻮﻫﺎ اﺳﺘﻔﺎده ﻣﯽﺷﻮﻧﺪ ]‪ .[6‬در ﻧﺘﺎﯾﺞ دوﻣﯿﻦ ﻣﻄﺎﻟﻌﻪ دﯾﺪه‬
‫ﻣﯽ ﺷﻮد از ﺑﯿﻦ ﺳﻪ ﻣﺪل ﭘﯿﺸﮕﻮﯾﯽ ﮐﻪ از ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ ﯾﺎ ﻃﺮاﺣﯽ و ﯾﺎ‬ ‫ﺗﺼﺤﯿﺢ آنﻫﺎ اﻏﻠﺐ ‪ %30‬ﺗﺎ ‪ %50‬از ﺑﻮدﺟﻪ ﭘﺮوژه را ﺑﻪ ﺧﻮد اﺧﺘﺼﺎص ﻣﯽدﻫﺪ‬
‫]‪ . [3‬اﯾﻦ ﻫﺰﯾﻨﻪ ﺑﻪ ﻋﻨﻮان ﻣﺘﺪﻫﺎﯾﯽ ﮐﻪ ﺑﺮاي ﺗﻀﻤﯿﻦ ﮐﯿﻔﯿﺖ ﻧﺮم اﻓﺰار ﻣﻮرد‬
‫ﺗﺮﮐﯿﺐ آن دو اﺳﺘﻔﺎده ﻣﯽﮐﻨﻨﺪ ﻣﺪل ﭘﯿﺸﮕﻮﯾﯽ ﮐﻪ از ﺗﺮﮐﯿﺐ آﻧﻬﺎ ﺳﺎﺧﺘﻪ‬
‫ﻧﯿﺎز اﺳﺖ ﻧﻤﯽﺗﻮاﻧﺪ ﺑﻪ ﻃﻮر ﮐﺎﻣﻞ ﺣﺬف ﺷﻮد اﻣﺎ ﺑﺎﯾﺪ ﺑﻪ وﺳﯿﻠﻪ ﻣﻌﺮﻓﯽ و ﺗﻮﺳﻌﻪ‬
‫ﻣﯽﺷﻮد ﺑﺎﻻﺗﺮﯾﻦ ﮐﺎراﯾﯽ و ﻣﺪل ﭘﯿﺸﮕﻮﯾﯽ ﮐﻪ از ﻣﺘﺮﯾﮏﻫﺎي ﻃﺮاﺣﯽ ﺳﺎﺧﺘﻪ‬
‫ﻣﺘﺪﻫﺎي ﺷﻨﺎﺳﺎﯾﯽ اﺗﻮﻣﺎﺗﯿﮏ و ﺳﺮﯾﻊ ﺧﻄﺎ ﮐﺎﻫﺶ ﻗﺎﺑﻞ ﻣﻼﺣﻈﻪاي ﺑﯿﺎﺑﺪ‪.‬‬
‫ﻣﯽﺷﻮﻧﺪ ﭘﺎﯾﯿﻦﺗﺮﯾﻦ ﮐﺎراﯾﯽ را دارﻧﺪ ]‪ .[7‬در ﺳﻮﻣﯿﻦ ﻣﻄﺎﻟﻌﻪ اﻇﻬﺎر ﺷﺪه اﺳﺖ‬
‫ﻫﻤﭽﻨﯿﻦ در ﻣﻘﺎﯾﺴﻪ ﺑﺎ ﻧﺮخ ‪ %60‬ﺷﻨﺎﺳﺎﯾﯽ اﺗﻮﻣﺎﺗﯿﮏ ﺧﻄﺎ ﻧﺴﺒﺖ ﺑﻪ ﻣﺮور‬
‫ﻣﺪل ﭘﯿﺸﮕﻮﯾﯽ ﮐﻪ از ﺗﺮﮐﯿﺐ ﻣﺘﺮﯾﮏﻫﺎي ﻃﺮاﺣﯽ ‪ UML‬و ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ‬
‫دﺳﺘﯽ ﻧﺮم اﻓﺰار )ﺑﺮ اﺳﺎس ﯾﮏ ﭘﺎﻧﻞ ﻣﺘﺮﯾﮏﻫﺎ در ‪ [4] ( IEEE 2002‬و در‬
‫اﺳﺘﻔﺎده ﻣﯽﮐﻨﺪ ﺑﻬﺘﺮﯾﻦ ﮐﺎراﯾﯽ را دارد و اﺳﺘﻔﺎده از ﻣﺘﺮﯾﮏﻫﺎي ‪ UML‬ﺑﻪ‬
‫ﻧﻈﺮ ﮔﺮﻓﺘﻦ اﯾﻦ ﮐﻪ ﯾﮏ ﻣﺮورﮔﺮ ﺧﺒﺮه ﻓﻘﻂ ﻣﯽﺗﻮاﻧﺪ ‪ 8‬ﺗﺎ ‪ 20‬ﺧﻂ از ﮐﺎراﮐﺘﺮ را‬
‫ﻋﻨﻮان ﭘﯿﺸﮕﻮ ﻧﺴﺒﺖ ﺑﻪ ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ‪ ،‬ﻋﻤﻠﮑﺮد ﺑﻬﺘﺮي دارد ]‪ .[8‬از آﻧﺠﺎﺋﯿﮑﻪ‬
‫در ﻫﻤﻪ ي ﻣﻄﺎﻟﻌﺎت ﻓﻮق ﮐﺎراﯾﯽ ﻣﺪل ﻫﺎي ﺳﺎﺧﺘﻪ ﺷﺪه ﺑﺮ اﺳﺎس ﻓﻘﻂ ﯾﮑﯽ‬
‫ﻧﻮﯾﺴﻨﺪه اول‪ ،‬داﻧﺸﮑﺪه ﻓﻨﯽ و ﻣﻬﻨﺪﺳﯽ‪ ،‬داﻧﺸﮕﺎه ﭘﯿﺎم ﻧﻮر ﺗﻬﺮان ﺷﻤﯿﺮاﻧﺎت‪ ،‬ﺗﻬﺮان‪ ،‬اﯾﺮان‬
‫دو ﻣﻌﯿﺎر آﻣﺎري ﺑﺮرﺳﯽ ﺷﺪه اﺳﺖ‪ ،‬در اﯾﻦ ﻣﻘﺎﻟﻪ از ﻣﻌﯿﺎر ﻫﺎي آﻣﺎري ﺑﯿﺸﺘﺮي‬
‫)‪(Zhr.eslami@gmail.com‬‬
‫اﺳﺘﻔﺎده ﺷﺪه اﺳﺖ ﺗﺎ ﻧﺘﺎﯾﺞ واﻗﻊ ﺑﯿﻨﺎﻧﻪ ﺗﺮي ﺑﻪ دﺳﺖ آﯾﺪ‪ .‬ﻫﺮ ﻣﺎژول ﺑﻪ وﺳﯿﻠﻪ‬
‫ﻧﻮﯾﺴﻨﺪه دوم‪ ،‬داﻧﺸﮑﺪه ﻣﻬﻨﺪﺳﯽ ﺑﺮق و ﮐﺎﻣﭙﯿﻮﺗﺮ‪ ،‬داﻧﺸﮕﺎه ﺷﯿﺮاز‪ ،‬ﺷﯿﺮاز‪ ،‬اﯾﺮان‬
‫ﯾﮏ ﻣﺠﻤﻮﻋﻪ از وﯾﮋﮔﯽﻫﺎي ﺳﻄﺢ ﮐﺪ و ﺳﻄﺢ ﻃﺮاﺣﯽ ﺗﻮﺻﯿﻒ ﻣﯽﺷﻮد‪ .‬اﯾﻦ‬
‫‪()asami@ieee.org‬‬
‫ﻣﻘﺎﻟﻪ روي ‪ 12‬ﻣﺠﻤﻮﻋﻪ داده ‪ [9] NASA‬ﮐﻪ در آن ﻣﺘﺮﯾﮏﻫﺎي ﻃﺮاﺣﯽ و‬ ‫ﻧﻮﯾﺴﻨﺪه ﺳﻮم‪ ،‬داﻧﺸﮑﺪه ﻓﻨﯽ و ﻣﻬﻨﺪﺳﯽ‪ ،‬داﻧﺸﮕﺎه ﭘﯿﺎم ﻧﻮر ﺗﻬﺮان ﺷﻤﯿﺮاﻧﺎت‪ ،‬ﺗﻬﺮان‪ ،‬اﯾﺮان‬
‫ﮐﺪ اﯾﺴﺘﺎ در دﺳﺘﺮس ﻫﺴﺘﻨﺪ‪ ،‬ﭘﯿﺎده ﺷﺪه اﺳﺖ ﮐﻪ در آن ﭘﺲ از ﺗﻮﺻﯿﻒ‬ ‫‪()afaraahi@pnu.ac.ir‬‬
‫‪ -3‬ﻃﺮاﺣﯽ آزﻣﺎﯾﺸﯽ‬ ‫ﻣﺠﻤﻮﻋﻪﻫﺎي داده‪ ،‬ﻧﺘﺎﯾﺞ آﻣﻮزش ﭘﯿﺸﮕﻮﻫﺎي ﺧﻄﺎ را روي ‪ -1‬ﻓﻘﻂ‬
‫‪ 12‬ﻣﺠﻤﻮﻋﻪ داده ‪NASA‬ﻓﺮاﺧﻮاﻧﯽ ﺷﺪه و از ‪ 5‬اﻟﮕﻮرﯾﺘﻢ دﺳﺘﻪ ﺑﻨﺪي‪ 6‬در‬ ‫ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ اﯾﺴﺘﺎ ‪ -2‬ﻓﻘﻂ ﻣﺘﺮﯾﮏﻫﺎي ﻃﺮاﺣﯽ ‪ -3‬ﺗﺮﮐﯿﺒﯽ از‬
‫‪[11]WEKA‬ﮐﻪ در ﺟﺪول ‪ 3‬ﻧﺸﺎن داده ﺷﺪه ﺳﺎﺧﺘﻪ ﺷﺪه اﺳﺖ ﺑﺮاي‬ ‫ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ اﯾﺴﺘﺎ و ﻣﺘﺮﯾﮏﻫﺎي ﺳﻄﺢ ﻃﺮاﺣﯽ ﻧﺸﺎن ﻣﯽدﻫﯿﻢ‪.‬‬
‫ﺳﺎﺧﺖ ﻣﺪل ﭘﯿﺸﮕﻮﯾﯽ ﺧﻄﺎ اﺳﺘﻔﺎده ﺷﺪه اﺳﺖ )ﺟﻨﮕﻞﻫﺎي ﺗﺼﺎدﻓﯽ ﺑﺎ ‪500‬‬ ‫ﻧﺘﺎﯾﺞ ﺣﺎﺻﻞ ﺑﻪ ﺻﻮرت زﯾﺮ اﺳﺖ‪ (1 :‬ﻣﺪلﻫﺎي ﺳﺎﺧﺘﻪ ﺷﺪه ﺑﺎ اﺳﺘﻔﺎده از‬
‫درﺧﺖ رﺷﺪ ﯾﺎﻓﺘﻪ(‪ .‬ﮐﺎراﯾﯽ ﻣﺪلﻫﺎ ﯾﮏ ﺑﺎرﺑﺮ ﻣﺒﻨﺎي ﻣﻨﺤﻨﯽ‪ 7 ROC‬و ﻣﻨﻄﻘﻪ‬ ‫ﻣﺘﺮﯾﮏﻫﺎي ﻃﺮاﺣﯽ و ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ اﯾﺴﺘﺎ و ﺗﺮﮐﯿﺐ ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ و‬
‫زﯾﺮ ﻣﻨﺤﻨﯽ ) ‪(AUC‬و ﯾﮏ ﺑﺎر ﺑﺮ ﻣﺒﻨﺎي ﻣﻌﯿﺎر ‪ F‬ارزﯾﺎﺑﯽ ﺷﺪه اﺳﺖ‪ .‬از‬ ‫ﻃﺮاﺣﯽ ﻣﻔﯿﺪﻧﺪ؛ ‪ (2‬ﺑﺎ ﺗﻮﺟﻪ ﺑﻪ ﻧﻤﻮدارﻫﺎي ﺟﻌﺒﻪاي‪ 2‬و ﺗﺴﺖﻫﺎي آﻣﺎري‪،‬‬
‫ﻧﻤﻮدارﻫﺎي ﺟﻌﺒﻪاي ﺟﻬﺖ ﻧﻤﺎﯾﺶ ﮔﺮاﻓﯿﮑﯽ ﮐﺎراﯾﯽ ﻣﺪلﻫﺎ اﺳﺘﻔﺎده ﻣﯽﺷﻮد‪ .‬ﻣﺎ‬ ‫ﮐﺎراﯾﯽ ﻣﺘﺮﯾﮏﻫﺎي ﻃﺮاﺣﯽ در ﭘﯿﺸﮕﻮﯾﯽ ﺧﻄﺎي ﻧﺮم اﻓﺰار ﻧﺴﺒﺖ ﺑﻪ‬
‫ﮐﺎراﯾﯽ ﻣﺪلﻫﺎي ﺳﺎﺧﺘﻪ ﺷﺪه از ﻣﺘﺮﯾﮏﻫﺎ در ﺳﻪ ﮔﺮوه ﻃﺮاﺣﯽ و ﮐﺪ و ﻫﻤﻪ را‬ ‫ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ و ﺗﺮﮐﯿﺐ آن دو ﺿﻌﯿﻒﺗﺮ اﺳﺖ؛ ‪ (3‬ﻣﺪل ﭘﯿﺸﮕﻮﯾﯽ ﺧﻄﺎي‬
‫ﺑﺎ ﻫﻢ ﻣﻘﺎﯾﺴﻪ ﻣﯽﮐﻨﯿﻢ‪.‬‬ ‫ﻧﺮم اﻓﺰار ﻣﺒﺘﻨﯽ ﺑﺮ ﻣﻌﯿﺎر ‪ F‬ﻧﺴﺒﺖ ﺑﻪ ﻣﺪل ﭘﯿﺸﮕﻮﯾﯽ ﺧﻄﺎي ﻧﺮم اﻓﺰار ﻣﺒﺘﻨﯽ‬
‫ﺳﭙﺲ از ﺗﺴﺖﻫﺎي آﻣﺎري ﻏﯿﺮ ﭘﺎراﻣﺘﺮي دﻣﺴﺎر]‪ [12‬ﺑﺮاي ﻣﻘﺎﯾﺴﻪ ﮐﺎراﯾﯽ‬ ‫ﺑﺮ‪ 3AUC‬ﮐﺎراﯾﯽ ﺑﻬﺘﺮي را روي ﺳﻪ ﮔﺮوه از ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ و ﻃﺮاﺣﯽ و‬
‫ﻣﺪلﻫﺎي ﺑﻪ وﺟﻮد آﻣﺪه از ﺳﻪ ﮔﺮوه ﻣﺘﺮﯾﮏ ﮐﺪ و ﻃﺮاﺣﯽ و ﺗﺮﮐﯿﺐ آن دو در‬ ‫ﺗﺮﮐﯿﺐ ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ و ﻃﺮاﺣﯽ اراﺋﻪ ﮐﺮده اﺳﺖ‪.‬‬
‫ﻣﺪلﻫﺎي ﻣﺒﺘﻨﯽ ﺑﺮ ‪ AUC‬و ﻫﻤﭽﻨﯿﻦ ﺑﻪ ﻃﻮر ﺟﺪاﮔﺎﻧﻪ در ﻣﺪلﻫﺎي ﻣﺒﺘﻨﯽ ﺑﺮ‬ ‫ﺳﺎﺧﺘﺎر ﻣﻘﺎﻟﻪ ﺷﺎﻣﻞ ﻣﻮارد زﯾﺮ ﻣﯽ ﺑﺎﺷﺪ‪ :‬در ﺑﺨﺶ دوم ﭘﺮوژه ﻫﺎ و‬
‫ﻣﻌﯿﺎر ‪ F‬اﺳﺘﻔﺎده ﺷﺪه اﺳﺖ‪ .‬اﯾﻦ ﺗﺴﺖ در دو ﻣﺮﺣﻠﻪ اﻧﺠﺎم ﻣﯽﮔﯿﺮد‪.‬‬ ‫ﻣﺘﺮﯾﮏﻫﺎي ﻧﺮم اﻓﺰار ﺑﺮرﺳﯽ ﺷﺪه اﺳﺖ‪ .‬در ﺑﺨﺶ ﺳﻮم ﻃﺮاﺣﯽ آزﻣﺎﯾﺸﯽ‬
‫اﺑﺘﺪا از ﺗﺴﺖ ﻓﺮﯾﺪﻣﻦ‪ 8‬ﺑﺮاي ﻣﻘﺎﯾﺴﻪ ﺳﻪ ﮔﺮوه ﻣﺘﺮﯾﮏﻫﺎ ﺑﺎ ﻫﻢ در ﻫﺮ‬ ‫ﺑﺮاي ﺳﺎﺧﺖ ﻣﺪل ﭘﯿﺸﮕﻮي ﺧﻄﺎي ﻧﺮم اﻓﺰار ﺑﺎ اﻧﺘﺨﺎب ﺗﮑﻨﯿﮏﻫﺎي‬
‫ﻣﺠﻤﻮﻋﻪ داده اﺳﺘﻔﺎده ﻣﯽﺷﻮد و در ﺻﻮرﺗﯽ ﮐﻪ اﺧﺘﻼف ﻗﺎﺑﻞ ﺗﻮﺟﻬﯽ ﺑﯿﻦ‬ ‫ﻣﺪلﺳﺎزي اﻧﺠﺎم ﻣﯽﺷﻮد‪ .‬ﺑﺨﺶ ﭼﻬﺎرم ﺷﺎﻣﻞ اراﺋﻪ ﻧﺘﺎﯾﺞ ﺗﺠﺮﺑﯽ و ﺑﺤﺚ روي‬
‫ﮐﺎراﯾﯽ اﯾﻦ ﺳﻪ ﮔﺮوه وﺟﻮد داﺷﺘﻪ ﺑﺎﺷﺪ از ﺗﺴﺖ وﯾﻠﮑﺎﮐﺴﻮن‪ 9‬ﺑﺮاي ﻣﻘﺎﯾﺴﻪ دو‬ ‫ﭘﯿﺎده ﺳﺎزي ﻣﺪلﻫﺎي ﭘﯿﺸﮕﻮﯾﯽ ﺧﻄﺎ ﻣﺒﺘﻨﯽ ﺑﺮ ‪ AUC‬و ﻣﺪلﻫﺎي ﻣﺒﺘﻨﯽ ﺑﺮ‬
‫ﺑﻪ دو از ﻣﺪلﻫﺎي ﺑﻪ وﺟﻮد آﻣﺪه ازﺳﻪ ﮔﺮوه ﻣﺘﺮﯾﮏﻫﺎ در ﻫﺮ ﻣﺠﻤﻮﻋﻪ داده‬ ‫ﻣﻌﯿﺎر ‪ 4F‬اﺳﺖ و ﮐﺎراﯾﯽ آنﻫﺎ ﻣﻘﺎﯾﺴﻪ ﺷﺪه اﺳﺖ‪ .‬ﺑﺨﺶ ﭘﻨﺠﻢ‪ ،‬ﮐﺎرﻫﺎي‬
‫اﺳﺘﻔﺎده ﻣﯽﺷﻮد‪ .‬از آﻧﺠﺎﺋﯿﮑﻪ در ﮔﺮوه ﻫﻤﻪ‪ ،‬ﺗﻮزﯾﻊ ﻏﯿﺮ ﻧﺮﻣﺎل دارﯾﻢ ﻫﺮ ﭼﻨﺪ در‬ ‫ﻣﺮﺗﺒﻂ ﭘﯿﺸﯿﻦ و ﺑﺨﺶ ﺷﺸﻢ ﺑﻪ ﺟﻤﻊﺑﻨﺪي و ﻧﺘﯿﺠﻪﮔﯿﺮي اﺧﺘﺼﺎص ﯾﺎﻓﺘﻪ‬
‫ﮐﺪ و ﻃﺮاﺣﯽ ﺗﻮزﯾﻊ ﻧﺮﻣﺎل اﺳﺖ وﻟﯽ ﻣﺠﺒﻮرﯾﻢ از ﺗﺴﺖﻫﺎي ﻏﯿﺮ ﭘﺎراﻣﺘﺮي‬ ‫اﺳﺖ‪.‬‬
‫اﺳﺘﻔﺎده ﮐﻨﯿﻢ‪ ،‬ﻓﺮض ﻣﯽﺷﻮد ﮐﻪ دو ﻣﺪل ‪ M‬و ‪ N‬از ﻣﺘﺮﯾﮏﻫﺎي ﻣﺨﺘﻠﻒ ﺑﺎ ‪5‬‬
‫‪ -2‬ﻣﺠﻤﻮﻋﻪ ﻫﺎي داده و ﻣﺘﺮﯾﮏﻫﺎ‬
‫ﺗﮑﻨﯿﮏ ﻣﺪل ﺳﺎزي در ﯾﮏ ﻣﺠﻤﻮﻋﻪ داده دارﯾﻢ و ﻣﯽﺧﻮاﻫﯿﻢ ﺑﻬﺘﺮﯾﻦ ﻣﺪل را‬
‫دوازده ﻣﺠﻤﻮﻋﻪ داده اﺳﺘﻔﺎده ﺷﺪه در اﯾﻦ ﻣﻄﺎﻟﻌﻪ از اﻧﺒﺎره داده ﻣﺠﻤﻮﻋﻪ‬
‫از ﺑﯿﻦ دو ﻣﺪل ‪M‬و ‪N‬اﻧﺘﺨﺎب ﮐﻨﯿﻢ‪ .‬ﻓﺮﺿﯿﻪﻫﺎي ﺗﺴﺖ آﻣﺎري ﻣﻨﺎﺳﺐ‬
‫ﻓﻀﺎﯾﯽ آﻣﺮﯾﮑﺎ ‪ NASA‬اﺳﺖ ]‪ [10‬ﮐﻪ در ﺟﺪول ‪ 1‬ﻧﺸﺎن داده ﺷﺪه اﺳﺖ‪.‬‬
‫ﻋﺒﺎرﺗﻨﺪ از ‪:‬‬
‫اﯾﻦ ﻣﺠﻤﻮﻋﻪﻫﺎي داده ﮐﻪ در اﻧﺒﺎره داده ﭘﺮاﻣﯿﺲ ﻫﻢ در دﺳﺘﺮس ﻫﺴﺘﻨﺪ ﺑﻪ‬
‫‪ : H0‬ﻫﯿﭻ اﺧﺘﻼﻓﯽ در ﮐﺎراﯾﯽ ﻣﺪلﻫﺎﯾﯽ ﮐﻪ از ﻣﺘﺮﯾﮏﻫﺎي ﮔﺮوه ‪ M‬ﯾﺎ ‪N‬‬
‫‪١٠‬‬ ‫ﻣﺘﺮﯾﮏﻫﺎي ﻣﺎژوﻟﯽ اﺷﺎره ﻣﯽﮐﻨﻨﺪ ﮐﻪ ‪ 12‬ﭘﺮوژه ﮔﻮﻧﺎﮔﻮن از ‪ NASA‬را‬
‫ﺗﺮ ‪(٠/٠٥‬‬ ‫‪p‬‬ ‫اﺳﺘﻔﺎده ﻣﯽﮐﻨﻨﺪ وﺟﻮد ﻧﺪارد‪) .‬د‬
‫ﺗﻮﺻﯿﻒ ﻣﯽﮐﻨﺪ‪ .‬در اﯾﻦ ﭘﺮوژه ﻫﺎ‪ ،‬ﯾﮏ ﻣﺸﺨﺼﻪ دودوﯾﯽ ﮐﻪ ﻣﺘﻐﯿﺮ ﭘﯿﺸﮕﻮﯾﯽ‬
‫‪ :H1‬ﮐﺎراﯾﯽ ﻣﺪل ﮔﺮوه ‪ M‬از ﮐﺎراﯾﯽ ﻣﺪل ﮔﺮوه ‪ N‬ﺑﻬﺘﺮ اﺳﺖ‪.‬‬
‫ﺷﺪه اﺳﺖ و ﺧﻂ‪5‬ا ﻧﺎﻣﯿﺪه ﻣﯽﺷﻮد وﺟﻮد دارد‪.‬‬
‫‪ : H2‬ﮐﺎراﯾﯽ ﻣﺪل ﮔﺮوه ‪ M‬از ﮐﺎراﯾﯽ ﻣﺪل ﮔﺮوه ‪ N‬ﺑﺪﺗﺮ اﺳﺖ‪.‬‬
‫در اﯾﻦ ﻣﻄﺎﻟﻌﻪ ﻃﺒﻖ ﻣﻌﯿﺎر ﺗﻘﺴﯿﻢ ﺑﻨﺪي ﺟﯿﺎن و ﻫﻤﮑﺎران ]‪[7‬ﺳﻪ ﮔﺮوه‬
‫ﺗﺮﺳﯿﻢ ﻧﻤﻮدارﻫﺎي ﺟﻌﺒﻪاي و اﻧﺠﺎم ﺗﺴﺖﻫﺎي آﻣﺎري ﺑﻪ وﺳﯿﻠﻪ ﻧﺮم اﻓﺰار‬
‫ﻣﺘﺮﯾﮏ ﺑﺮاي ﻫﺮ ﻣﺎژول در ﻧﻈﺮ ﮔﺮﻓﺘﻪ ﺷﺪه ﮐﻪ در ﺟﺪول ‪ 2‬ﻣﻮﺟﻮداﺳﺖ و‬
‫‪ SPSS‬اﻧﺠﺎم ﺷﺪه اﺳﺖ]‪.[13‬‬
‫ﺷﺎﻣﻞ ﻣﺘﺮﯾﮏ ﻫﺎي ﻃﺮاﺣﯽ و ﻣﺘﺮﯾﮏ ﻫﺎي ﮐﺪ و ﻣﺘﺮﯾﮏﻫﺎي دﯾﮕﺮﻣﯽ ﺑﺎﺷﺪ‪.‬‬
‫‪ -4‬ﻧﺘﺎﯾﺞ ﺗﺠﺮﺑﯽ‬ ‫ﻣﺘﺮﯾﮏﻫﺎي دﯾﮕﺮ‪ ،‬ﻫﻢ ﺑﺎ ﻃﺮاﺣﯽ و ﻫﻢ ﺑﺎ ﮐﺪ ﻣﺮﺑﻮط ﻣﯽﺷﻮﻧﺪ‪ .‬ﺑﻌﻀﯽ‬
‫در اﯾﻦ ﺑﺨﺶ ﻣﺎ ﻧﺘﺎﯾﺞ آزﻣﺎﯾﺸﺎت اﻧﺠﺎم ﺷﺪه را ﮐﻪ ﺷﺎﻣﻞ ﻧﻤﻮدارﻫﺎي ﺟﻌﺒﻪاي‬ ‫ﻣﺠﻤﻮﻋﻪﻫﺎي داده ﻣﺜﻞ ‪ 4 ،PC5‬ﻣﺘﺮﯾﮏ دارﻧﺪ ﮐﻪ ﻣﺎ آنﻫﺎ را در ﺳﺘﻮن دﯾﮕﺮ‬
‫و ﺗﺴﺖﻫﺎي آﻣﺎري اﺳﺖ ﯾﮏ ﺑﺎر ﺑﺮ ﻣﺒﻨﺎي ‪ AUC‬و ﯾﮏ ﺑﺎر ﺑﺮ ﻣﺒﻨﺎي ﻣﻌﯿﺎر‬ ‫دﺳﺘﻪ ﺑﻨﺪي ﮐﺮدهاﯾﻢ‪ .‬ﺑﻌﻀﯽ از ﻣﺠﻤﻮﻋﻪﻫﺎي داده ﻣﺜﻞ ‪ CM1‬ﻫﯿﭻ ﻣﺘﺮﯾﮑﯽ‬
‫‪ F‬اراﺋﻪ ﻣﯽ ﺷﻮد و ﺳﭙﺲ ﻣﻘﺎﯾﺴﻪاي ﺑﯿﻦ ﻣﺪل ﻫﺎ اﻧﺠﺎم ﻣﯽ ﺷﻮد‪.‬‬ ‫ﺟﺰء دﯾﮕﺮ ﻧﺪارﻧﺪ‪ .‬ﺑﻪ ﻋﻼوه ﻣﺎ ﯾﮏ ﮔﺮوﻫﯽ را ﮐﻪ ﻫﻤﻪ ﻧﺎﻣﯿﺪه ﻣﯽﺷﻮد ﺗﻌﺮﯾﻒ‬
‫ﻣﯽﮐﻨﯿﻢ ﮐﻪ ﺷﺎﻣﻞ ﻣﺠﻤﻮﻋﻪ ﮐﺎﻣﻠﯽ از ﻣﺘﺮﯾﮏﻫﺎي ﻣﺎژول اﺳﺖ‪.‬‬
‫‪ -1- 4‬ﻧﺘﺎﯾﺞ ﺗﺠﺮﺑﯽ ﻣﺒﺘﻨﯽ ﺑﺮ ‪AUC‬‬
‫‪ ‬در ‪ 3‬ﻣﻮرد ﮐﺎراﯾﯽ ﻣﺪلﻫﺎي ﺳﺎﺧﺘﻪ ﺷﺪه از ﮔﺮوه ﻣﺘﺮﯾﮏ ﻃﺮاﺣﯽ ﮐﻢﺗﺮﯾﻦ‬ ‫‪ -1-1-4‬ﻧﻤﻮدارﻫﺎي ﺟﻌﺒﻪاي ﻣﺒﺘﻨﯽ ﺑﺮ ‪AUC‬‬
‫اﺳﺖ‪.‬‬ ‫ﺷﮑﻞ ‪ 1‬ﻧﻤﻮدارﻫﺎي ﺟﻌﺒﻪاي ﺑﺮاي ‪ AUC‬از ‪ 12‬ﻣﺠﻤﻮﻋﻪ داده دﯾﮕﺮ را ﻧﺸﺎن‬
‫‪ -3-4‬ﻣﻘﺎﯾﺴﻪ ﻣﺪل ﻫﺎ‬ ‫ﻣﯽدﻫﺪ‪ .‬از اﯾﻦ ﻧﻤﻮدارﻫﺎي ﺟﻌﺒﻪاي روﻧﺪ زﯾﺮ ﻣﺸﺎﻫﺪه ﻣﯽ ﺷﻮد‪.‬‬
‫‪ ‬در ﮐﺎراﯾﯽ ﻣﺪلﻫﺎﯾﯽ ﮐﻪ از ﺗﺮﮐﯿﺐ ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ و ﻃﺮاﺣﯽ اﺳﺘﻔﺎده‬
‫ﻣﻘﺎﯾﺴﻪ ﺑﯿﻦ ﻣﺪلﻫﺎي ﭘﯿﺸﮕﻮﯾﯽ ﺧﻄﺎي ﻧﺮم اﻓﺰار ﻣﺒﺘﻨﯽ ﺑﺮ ‪ AUC‬و ﻣﺒﺘﻨﯽ ﺑﺮ‬
‫ﻣﯽﮐﻨﻨﺪ ﻧﺴﺒﺖ ﺑﻪ ﻣﺪلﻫﺎﯾﯽ ﮐﻪ از ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ اﺳﺘﻔﺎده ﻣﯽﮐﻨﻨﺪ‬
‫ﻣﻌﯿﺎر ‪ F‬ﺑﺎ ﻣﻘﺎﯾﺴﻪ ﻧﻤﻮدارﻫﺎي ﺟﻌﺒﻪاي آنﻫﺎ روي ﻣﺠﻤﻮﻋﻪﻫﺎي داده ﯾﮑﺴﺎن‬
‫ﭘﯿﺸﺮﻓﺖ ﻗﺎﺑﻞ ﺗﻮﺟﻬﯽ وﺟﻮد ﻧﺪارد‪.‬‬
‫اﻣﮑﺎن ﭘﺬﯾﺮ اﺳﺖ‪ .‬ﺑﺎ ﻣﻘﺎﯾﺴﻪ اﯾﻦ ﻧﻤﻮدار ﻫﺎ در ﯾﮏ ﭘﺮوژه واﺣﺪ در ﺷﮑﻞ ‪ 1‬و ‪2‬‬ ‫‪ ‬ﮐﺎراﯾﯽ ﻣﺪلﻫﺎﯾﯽ ﮐﻪ از ﻣﺘﺮﯾﮏﻫﺎي ﻃﺮاﺣﯽ اﺳﺘﻔﺎده ﻣﯽﮐﻨﻨﺪ در اﮐﺜﺮ‬
‫ﻣﻼﺣﻈﻪ ﻣﯽﺷﻮد ﻣﺪل ﭘﯿﺸﮕﻮﯾﯽ ﺧﻄﺎي ﻧﺮم اﻓﺰار ﻣﺒﺘﻨﯽ ﺑﺮ ﻣﻌﯿﺎر ‪ F‬ﻧﺴﺒﺖ ﺑﻪ‬ ‫ﻣﻮارد ﭘﺎﺋﯿﻦ ﺗﺮﯾﻦ اﺳﺖ‪.‬‬
‫ﻣﺪل ﻣﺒﺘﻨﯽ ﺑﺮ ‪ AUC‬ﮐﺎراﯾﯽ ﺑﻬﺘﺮي را در ﻫﺮ ﺳﻪ ﮔﺮوه از ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ و‬
‫‪ -2-1-4‬ﺗﺴﺖﻫﺎي آﻣﺎري ﻣﺒﺘﻨﯽ ﺑﺮ ‪AUC‬‬
‫ﻃﺮاﺣﯽ و ﺗﺮﮐﯿﺐ آن دو اراﺋﻪ ﮐﺮده اﺳﺖ و اﯾﻦ ﻧﺘﯿﺠﻪ در اﮐﺜﺮ ﻣﻘﺎﯾﺴﻪ ﻧﻤﻮدارﻫﺎ‬
‫ﺟﺪول ‪ 4‬ﻧﺘﺎﯾﺞ ﺗﺴﺖ ﻓﺮﯾﺪﻣﻦ و ﺟﺪول ‪ 5‬ﻧﺘﺎﯾﺞ ﺗﺴﺖ وﯾﻠﮑﺎﮐﺴﻮن را روي‬
‫ﺑﻪ وﺿﻮح‪ ،‬ﻣﺸﻬﻮد اﺳﺖ‪.‬‬
‫ﻣﺠﻤﻮﻋﻪ ﻫﺎي داده ‪ NASA‬ﻧﺸﺎن ﻣﯽدﻫﺪ‪ .‬ﻧﺘﺎﯾﺞ ﺗﺴﺖﻫﺎ ﺑﻪ ﺻﻮرت زﯾﺮ‬
‫ﮐﺎرﻫﺎي ﻣﺮﺗﺒﻂ ﭘﯿﺸﯿﻦ‬ ‫‪-5‬‬
‫ﺑﯿﺎن ﻣﯽﺷﻮد ‪:‬‬
‫اوﻟﯿﻦ ﮐﺎر داده ﮐﺎوي ﺗﻮﺳﻂ ﺳﻠﺒﯽ و ﭘﻮرﺗﺮ ]‪ [5‬اﻧﺠﺎم ﺷﺪه اﺳﺖ‪ .‬آﻧﻬﺎ از ‪16‬‬ ‫‪ ‬در ‪ 3‬ﻣﻮرد ﮐﺎراﯾﯽ ﻣﺪلﻫﺎي ﺳﺎﺧﺘﻪ ﺷﺪه از ﮔﺮوه ﻣﺘﺮﯾﮏﻫﺎي ﻫﻤﻪ و ﮐﺪ و‬
‫ﭘﺮوژه ﻧﺎﺳﺎ اﺳﺘﻔﺎده ﮐﺮدﻧﺪ و ﯾﮏ روش ﺧﻮدﮐﺎر ﺑﺮاي ﺗﻮﻟﯿﺪ ﻣﺪل ﻫﺎي ﺗﺠﺮﺑﯽ‬ ‫ﻃﺮاﺣﯽ ﺑﺮاﺑﺮﻧﺪ‪.‬‬
‫ﻣﺒﺘﻨﯽ ﺑﺮ اﺷﯿﺎ ﺑﺮاي ﺷﻨﺎﺳﺎﯾﯽ ﺧﻄﺎﻫﺎي ﻧﺮم اﻓﺰار اراﺋﻪ ﮐﺮدﻧﺪ‪ .‬ﺑﻌﺪ از آن ﻧﯿﺰ‬ ‫‪ ‬در ‪ 11‬ﻣﻮرد ﮐﺎراﯾﯽ ﻣﺪلﻫﺎي ﺳﺎﺧﺘﻪ ﺷﺪه از ﮔﺮوه ﻣﺘﺮﯾﮏﻫﺎي ﻫﻤﻪ و ﮐﺪ‬
‫ﺑﺴﯿﺎري از ﻣﺤﻘﻘﺎن روي ﻣﻮﺿﻮع ﭘﯿﺸﮕﻮﯾﯽ ﺧﻄﺎي ﻧﺮم اﻓﺰار ﮐﺎر ﮐﺮداﻧﺪ و‬ ‫ﺑﺮاﺑﺮﻧﺪ‪.‬‬
‫ﺑﺮاي ﺑﻪ دﺳﺖ آوردن ﻣﺪلﻫﺎي ﭘﯿﺸﮕﻮﯾﯽ ﺻﺤﯿﺢ ﺗﻼش ﺷﺪه اﺳﺖ‪ .‬وﻟﯽ ﺗﻨﻬﺎ‬ ‫‪ ‬در ‪ 9‬ﻣﻮرد ﮐﺎراﯾﯽ ﻣﺪلﻫﺎي ﺳﺎﺧﺘﻪ ﺷﺪه از ﮔﺮوه ﻣﺘﺮﯾﮏ ﻃﺮاﺣﯽ ﮐﻢﺗﺮﯾﻦ‬
‫اﺳﺖ‪.‬‬
‫ﺳﻪ ﻣﻄﺎﻟﻌﻪ اﺳﺖ ﮐﻪ ﮐﺎراﯾﯽ ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ و ﻃﺮاﺣﯽ را در ﭘﯿﺸﮕﻮﯾﯽ ﺧﻄﺎي‬
‫ﻧﺮم اﻓﺰار ﻣﻘﺎﯾﺴﻪ ﻣﯽﮐﻨﺪ ‪ :‬اوﻟﯿﻦ ﻣﻄﺎﻟﻌﻪ ﺑﻪ وﺳﯿﻠﻪ ژﺋﻮ و ﻫﻤﮑﺎراﻧﺶ در ]‪[6‬‬ ‫‪ -2- 4‬ﻧﺘﺎﯾﺞ ﺗﺠﺮﺑﯽ ﻣﺒﺘﻨﯽ ﺑﺮ ﻣﻌﯿﺎر ‪F‬‬
‫اﺳﺖ‪ .‬آﻧﻬﺎ ﻣﺘﺮﯾﮏﻫﺎي ﻃﺮاﺣﯽ را از ﮔﺮاف ‪ FDL‬از ﯾﮏ ﺳﯿﺴﺘﻢ ﺑﻼدرﻧﮓ‬ ‫‪ -1-2-4‬ﻧﻤﻮدارﻫﺎي ﺟﻌﺒﻪاي ﻣﺒﺘﻨﯽ ﺑﺮ ﻣﻌﯿﺎر ‪F‬‬
‫ﺟﻤﻊ آوري ﮐﺮدﻧﺪ و اﻇﻬﺎر ﮐﺮدﻧﺪ ﮐﻪ ﻣﺪل ﭘﯿﺸﮕﻮﯾﯽ ﮐﻪ از ﻣﺘﺮﯾﮏﻫﺎي‬ ‫ﺷﮑﻞ ‪ 2‬ﻧﻤﻮدارﻫﺎي ﺟﻌﺒﻪاي ﺑﺮاي ﻣﻌﯿﺎر ‪ F‬از ‪ 12‬ﻣﺠﻤﻮﻋﻪ داده را ﻧﺸﺎن‬
‫ﻃﺮاﺣﯽ اﺳﺘﻔﺎده ﻣﯽﮐﻨﺪ ﺑﻪ ﺧﻮﺑﯽ ﻣﺪﻟﯽ اﺳﺖ ﮐﻪ از ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ اﺳﺘﻔﺎده‬ ‫ﻣﯽدﻫﺪ‪ .‬از اﯾﻦ ﻧﻤﻮدارﻫﺎي ﺟﻌﺒﻪاي ﻧﺘﺎﯾﺞ زﯾﺮ ﻣﺸﻬﻮد اﺳﺖ‪:‬‬
‫ﻣﯽﮐﻨﺪ و ﭘﯿﺸﺮﻓﺖ ﻣﻬﻤﯽ وﺟﻮد ﻧﺪارد ﻣﻮﻗﻌﯽ ﮐﻪ ﻣﺘﺮﯾﮏﻫﺎي ﻃﺮاﺣﯽ و ﮐﺪ‬ ‫‪ ‬ﮐﺎراﯾﯽ ﻣﺪلﻫﺎﯾﯽ ﮐﻪ از ﺗﺮﮐﯿﺐ ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ و ﻃﺮاﺣﯽ اﺳﺘﻔﺎده‬
‫ﺗﺮﮐﯿﺐ ﻣﯽﺷﻮﻧﺪ و ﺑﺎ ﻫﻢ ﺑﻪ ﻋﻨﻮان ﭘﯿﺸﮕﻮﻫﺎ اﺳﺘﻔﺎده ﻣﯽﺷﻮﻧﺪ‪ .‬دوﻣﯿﻦ ﻣﻄﺎﻟﻌﻪ‬ ‫ﻣﯽﮐﻨﻨﺪ ﻧﺴﺒﺖ ﺑﻪ ﻣﺪلﻫﺎﯾﯽ ﮐﻪ از ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ اﺳﺘﻔﺎده ﻣﯽﮐﻨﻨﺪ‬
‫ﺑﻪ وﺳﯿﻠﻪ ﺟﯿﺎن و ﻫﻤﮑﺎراﻧﺶ ]‪ [7‬ﺻﻮرت ﮔﺮﻓﺘﻪ اﺳﺖ ﮐﻪ ﻣﺪلﻫﺎي ﭘﯿﺸﮕﻮﯾﯽ‬ ‫ﺗﻘﺮﯾﺒﺎً ﺑﺮاﺑﺮ اﺳﺖ‪.‬‬
‫ﺳﺎﺧﺘﻪ ﺷﺪه ﺑﺎ اﺳﺘﻔﺎده از ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ و ﻃﺮاﺣﯽ روي ﻣﺠﻤﻮﻋﻪ داده‬ ‫‪ ‬ﮐﺎراﯾﯽ ﻣﺪلﻫﺎﯾﯽ ﮐﻪ از ﻣﺘﺮﯾﮏﻫﺎي ﻃﺮاﺣﯽ اﺳﺘﻔﺎده ﻣﯽﮐﻨﻨﺪ ﻧﺴﺒﺖ ﺑﻪ‬
‫‪ NASA‬را ﻣﻘﺎﯾﺴﻪ ﮐﺮده اﻧﺪ‪ .‬آﻧﻬﺎ ﻣﺘﺮﯾﮏﻫﺎي ﻃﺮاﺣﯽ را از ﮔﺮافﻫﺎي‬ ‫ﻣﺪلﻫﺎﯾﯽ ﮐﻪ از ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ ﯾﺎ ﺗﺮﮐﯿﺐ آن دو اﺳﺘﻔﺎده ﻣﯽﮐﻨﻨﺪ در‬
‫ﻧﯿﻤﯽ از ﻣﻮارد ﺑﺮاﺑﺮ و در ﺗﻌﺪاد ﻣﺤﺪودي از ﻣﻮارد ﭘﺎﺋﯿﻦ ﺗﺮ ﯾﻦ اﺳﺖ‪.‬‬
‫‪ FDL‬و دﯾﺎﮔﺮامﻫﺎي ‪ UML‬ﺟﻤﻊ آوري ﮐﺮده و از آنﻫﺎ ﺑﻪ ﻋﻨﻮان ﭘﯿﺸﮕﻮﻫﺎ‬
‫اﺳﺘﻔﺎده ﮐﺮدﻧﺪ و اﻇﻬﺎر ﮐﺮدﻧﺪ از ﺑﯿﻦ ﺳﻪ ﻣﺪل ﭘﯿﺸﮕﻮﯾﯽ ﮐﻪ از ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ‬ ‫‪ -2-2-4‬ﺗﺴﺖﻫﺎي آﻣﺎري ﻣﺒﺘﻨﯽ ﺑﺮ ﻣﻌﯿﺎر ‪F‬‬
‫ﯾﺎ ﻃﺮاﺣﯽ و ﯾﺎ ﺗﺮﮐﯿﺐ آن دو اﺳﺘﻔﺎده ﻣﯽﮐﻨﻨﺪ ﻣﺪل ﭘﯿﺸﮕﻮﯾﯽ ﮐﻪ از ﺗﺮﮐﯿﺐ‬ ‫ﺟﺪول ‪ 6‬ﻧﺘﺎﯾﺞ ﺗﺴﺖ ﻓﺮﯾﺪﻣﻦ و ﺟﺪول ‪ 7‬ﻧﺘﺎﯾﺞ ﺗﺴﺖ وﯾﻠﮑﺎﮐﺴﻮن را روي‬
‫ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ و ﻃﺮاﺣﯽ ﺳﺎﺧﺘﻪ ﻣﯽﺷﻮد ﺑﺎﻻﺗﺮﯾﻦ ﮐﺎراﯾﯽ و ﻣﺪل ﭘﯿﺸﮕﻮﯾﯽ‬ ‫ﻣﺠﻤﻮﻋﻪﻫﺎي داده ‪ NASA‬ﻧﺸﺎن ﻣﯽدﻫﺪ‪ .‬ﻧﺘﺎﯾﺞ اﯾﻦ ﺗﺴﺖﻫﺎ ﺑﻪ ﺻﻮرت زﯾﺮ‬
‫ﮐﻪ از ﻣﺘﺮﯾﮏﻫﺎي ﻃﺮاﺣﯽ ﺳﺎﺧﺘﻪ ﻣﯽﺷﻮﻧﺪ ﭘﺎﯾﯿﻦﺗﺮﯾﻦ ﮐﺎراﯾﯽ را دارﻧﺪ‪ .‬ﺳﻮﻣﯿﻦ‬ ‫ﺑﯿﺎن ﻣﯽﺷﻮد ‪:‬‬
‫ﻣﻄﺎﻟﻌﻪ ﺑﻪ وﺳﯿﻠﻪ ﻧﻮﮔﺮاﻫﻮ و ﻫﻤﮑﺎراﻧﺶ ]‪ [8‬ﺻﻮرت ﮔﺮﻓﺘﻪ اﺳﺖ آنﻫﺎ‬ ‫‪ ‬در ‪ 5‬ﻣﻮرد ﮐﺎراﯾﯽ ﻣﺪلﻫﺎي ﺳﺎﺧﺘﻪ ﺷﺪه از ﮔﺮوه ﻣﺘﺮﯾﮏﻫﺎي ﻫﻤﻪ و ﮐﺪ و‬
‫ﻣﺘﺮﯾﮏﻫﺎ را از دﯾﺎﮔﺮامﻫﺎي ﺗﺮﺗﯿﺒﯽ ﻣﺪل ‪ UML‬و از ﮐﺪ ﻣﻨﺒﻊ اﺳﺘﺨﺮاج‬ ‫ﻃﺮاﺣﯽ ﺑﺮاﺑﺮﻧﺪ‪.‬‬
‫ﮐﺮدﻧﺪ و ﺳﻪ ﻣﺪل ﭘﯿﺸﮕﻮﯾﯽ ﺑﺮ اﺳﺎس ﻣﺘﺮﯾﮏﻫﺎي ‪ UML‬و ﺑﺮ اﺳﺎس‬ ‫‪ ‬در ‪ 11‬ﻣﻮرد ﮐﺎراﯾﯽ ﻣﺪلﻫﺎي ﺳﺎﺧﺘﻪ ﺷﺪه از ﮔﺮوه ﻣﺘﺮﯾﮏﻫﺎي ﻫﻤﻪ و ﮐﺪ‬
‫ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ و ﺑﺮ اﺳﺎس ﺗﺮﮐﯿﺐ ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ و ‪ UML‬ﺳﺎﺧﺘﻨﺪ و‬ ‫ﺑﺮاﺑﺮﻧﺪ‪.‬‬
‫ﺟﺪول ‪ :3‬دﺳﺘﻪ ﺑﻨﺪي ﮐﻨﻨﺪه ﻫﺎ‬ ‫ﻧﺸﺎن دادﻧﺪ ﮐﻪ دو ﻣﺘﺮﯾﮏ ﻃﺮاﺣﯽ ‪ UML‬ﮐﻪ از دﯾﺎﮔﺮامﻫﺎي ﺗﺮﺗﯿﺒﯽ ﺑﻪ دﺳﺖ‬
‫آورده ﺑﻮدﻧﺪ‪ 1‬ﭘﯿﺸﮕﻮﻫﺎي ﻣﻬﻤﯽ از ﮐﻼس ﻫﺴﺘﻨﺪ‪ .‬ﻫﻤﭽﻨﯿﻦ آنﻫﺎ ﯾﺎﻓﺘﻨﺪ ﮐﻪ‬
‫‪5‬‬ ‫‪4‬‬ ‫‪3‬‬ ‫‪2‬‬ ‫‪1‬‬ ‫ردﯾﻒ‬
‫دﺳﺘﻪ ﺑﻨﺪي‬ ‫ﻣﺪل ﭘﯿﺸﮕﻮﯾﯽ ﮐﻪ از ﺗﺮﮐﯿﺐ ﻣﺘﺮﯾﮏﻫﺎي ﻃﺮاﺣﯽ ‪ UML‬و ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ‬
‫‪Naïve‬‬ ‫‪Logistic‬‬ ‫‪Random‬‬
‫‪Boosting‬‬ ‫‪Bagging‬‬
‫‪Bayes‬‬ ‫‪Regression‬‬ ‫‪Forest‬‬ ‫ﮐﻨﻨﺪه‬ ‫اﺳﺘﻔﺎده ﻣﯽﮐﻨﺪ ﺑﻬﺘﺮﯾﻦ ﮐﺎراﯾﯽ را دارد و اﺳﺘﻔﺎده از ﻣﺘﺮﯾﮏﻫﺎي ‪ UML‬ﺑﻪ‬
‫ﻋﻨﻮان ﭘﯿﺸﮕﻮ ﻧﺴﺒﺖ ﺑﻪ ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ‪ ،‬ﻋﻤﻠﮑﺮد ﺑﻬﺘﺮي دارد‪.‬‬
‫ﺟﺪول ‪ :5‬ﺗﺴﺖ وﯾﻠﮑﺎﮐﺴﻮن روي ﻣﺠﻤﻮﻋﻪ ﻫﺎي داده ‪NASA‬ﻣﺒﺘﻨﯽ ﺑﺮ ‪AUC‬‬ ‫ﺑﻪ ﻫﺮ ﺣﺎل‪ ،‬ﯾﺎﻓﺘﻪﻫﺎي آﻧﺎن ﻫﺮ ﮐﺪام ﺑﺮ اﺳﺎس ﺗﺤﻠﯿﻞﻫﺎﯾﯽ از ﺗﻌﺪادي‬
‫ﻣﺠﻤﻮﻋﻪ داده اﺳﺖ‪ .‬در اﯾﻦ ﻣﻘﺎﻟﻪ از آزﻣﺎﯾﺸﺎت ﻣﺘﻨﻮع ﺗﺮي اﺳﺘﻔﺎده ﺷﺪه اﺳﺖ‬
‫ﻣﺠﻤﻮﻋﻪ‬ ‫‪P‬ﻓﺮﺿﯿﻪﻫﺎ و ﻣﻘﺪار‬
‫ﻧﺘﺎﯾﺞ‬
‫ﮐﺪ ‪-‬ﻫﻤﻪ‬ ‫ﻃﺮاﺣﯽ ‪-‬ﻫﻤﻪ‬ ‫ﻃﺮاﺣﯽ ‪-‬ﮐﺪ‬ ‫و آﻣﺎر ﻗﺎﺑﻞ ﺗﻮﺟﻬﯽ ﻣﺸﺎﻫﺪه ﻣﯽ ﺷﻮد‪.‬‬
‫‪KC1‬‬ ‫‪1,H0‬‬ ‫‪0/043,H1‬‬ ‫‪0/043,H1‬‬ ‫ﻃﺮاﺣﯽ> ﮐﺪ = ﻫﻤﻪ‬
‫ﻧﺘﯿﺠﻪ ﮔﯿﺮي‬ ‫‪-6‬‬
‫‪KC3‬‬ ‫‪0/225.H0‬‬ ‫‪0/043,H1‬‬ ‫‪0/043.H1‬‬ ‫ﻃﺮاﺣﯽ> ﮐﺪ = ﻫﻤﻪ‬
‫‪PC1‬‬ ‫‪1,H0‬‬ ‫‪0/043,H1‬‬ ‫‪0/043,H1‬‬ ‫ﻃﺮاﺣﯽ> ﮐﺪ = ﻫﻤﻪ‬ ‫ﻫﺪف اﯾﻦ ﻣﻘﺎﻟﻪ ﺗﺄﺛﯿﺮ ﻣﺘﺮﯾﮏﻫﺎي ﻃﺮاﺣﯽ ﻧﺴﺒﺖ ﺑﻪ ﻣﺘﺮﯾﮏ ﻫﺎي ﮐﺪ در‬
‫‪PC2‬‬ ‫‪0/138,H0‬‬ ‫‪0/043,H1‬‬ ‫‪0/043,H1‬‬ ‫ﻃﺮاﺣﯽ> ﮐﺪ = ﻫﻤﻪ‬
‫‪PC3‬‬ ‫‪0/686,H0‬‬ ‫‪0/043,H1‬‬ ‫‪0/042,H1‬‬ ‫ﻃﺮاﺣﯽ> ﮐﺪ = ﻫﻤﻪ‬
‫ﺑﻬﺒﻮد ﮐﺎراﯾﯽ ﺳﺎﻣﺎﻧﻪﻫﺎي ﺗﺴﺖ اﺗﻮﻣﺎﺗﯿﮏ ﺑﻮده اﺳﺖ و از ‪ 11‬ﻣﺠﻤﻮﻋﻪ دادهي‬
‫‪PC4‬‬ ‫‪0/043,H1‬‬ ‫‪0/043,H1‬‬ ‫‪0/043,H1‬‬ ‫ﻃﺮاﺣﯽ> ﮐﺪ> ﻫﻤﻪ‬ ‫در دﺳﺘﺮس‪ ،‬از اﻧﺒﺎره داده ﭘﺮاﻣﯿﺲ اﺳﺘﻔﺎده ﺷﺪه اﺳﺖ ﮐﻪ ﺑﺎ ﺗﻮﺟﻪ ﺑﻪ‬
‫‪PC5‬‬ ‫‪0/5,H0‬‬ ‫‪0/5,H0‬‬ ‫‪0/416,H0‬‬ ‫ﻃﺮاﺣﯽ = ﮐﺪ = ﻫﻤﻪ‬
‫ﻧﻤﻮدارﻫﺎي ﺟﻌﺒﻪاي و ﺗﺴﺖﻫﺎي آﻣﺎري ﻧﺘﯿﺠﻪ دﯾﺪه ﻣﯽ ﺷﻮد در ﻋﻤﻠﮑﺮد‬
‫‪MC1‬‬ ‫‪0/279,H0‬‬ ‫‪0/043,H1‬‬ ‫‪0/043,H1‬‬ ‫ﻃﺮاﺣﯽ> ﮐﺪ = ﻫﻤﻪ‬
‫‪MC2‬‬ ‫‪0/684,H0‬‬ ‫‪0/043,H1‬‬ ‫‪0/043,H1‬‬ ‫ﻃﺮاﺣﯽ> ﮐﺪ = ﻫﻤﻪ‬ ‫ﻣﺪلﻫﺎﯾﯽ ﮐﻪ از ﺗﺮﮐﯿﺐ ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ و ﻃﺮاﺣﯽ اﺳﺘﻔﺎده ﻣﯽﮐﻨﻨﺪ ﻧﺴﺒﺖ ﺑﻪ‬
‫‪MW1‬‬ ‫‪0/144,H0‬‬ ‫‪0/686,H0‬‬ ‫‪0/08,H0‬‬ ‫ﻃﺮاﺣﯽ = ﮐﺪ = ﻫﻤﻪ‬
‫آنﻫﺎﯾﯽ ﮐﻪ از ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ اﺳﺘﻔﺎده ﻣﯽﮐﻨﻨﺪ ﺑﻬﺒﻮدي ﻗﺎﺑﻞ ﺗﻮﺟﻬﯽ ﻣﺸﺎﻫﺪه‬
‫‪CM1‬‬ ‫‪0/345,H0‬‬ ‫‪0/043,H1‬‬ ‫‪0/043,H1‬‬ ‫ﻃﺮاﺣﯽ> ﮐﺪ = ﻫﻤﻪ‬
‫‪KC2‬‬ ‫‪0/176,H0‬‬ ‫‪0/08,H0‬‬ ‫‪0/08,H0‬‬ ‫ﻃﺮاﺣﯽ = ﮐﺪ = ﻫﻤﻪ‬ ‫ﻧﻤﯽ ﺷﻮد ﻫﻤﭽﻨﯿﻦ ﻣﺘﺮﯾﮏﻫﺎي ﻃﺮاﺣﯽ ﻧﺴﺒﺖ ﺑﻪ ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ و ﯾﺎ ﺗﺮﮐﯿﺐ‬
‫ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ و ﻃﺮاﺣﯽ ﺗﺄﺛﯿﺮ ﮐﻤﺘﺮي ﺑﺮ اﻓﺰاﯾﺶ دﻗﺖ ﺳﺎﻣﺎﻧﻪﻫﺎي ﺗﺴﺖ‬
‫اﺗﻮﻣﺎﺗﯿﮏ دارد‪ .‬ﺿﻤﻨﺎً ﻣﺪل ﭘﯿﺸﮕﻮﯾﯽ ﺧﻄﺎي ﻧﺮم اﻓﺰار ﻣﺒﺘﻨﯽ ﺑﺮ ﻣﻌﯿﺎر ‪ F‬ﻧﺴﺒﺖ‬
‫ﺟﺪول ‪ :7‬ﺗﺴﺖ وﯾﻠﮑﺎﮐﺴﻮن روي ‪ NASA‬ﻣﺒﺘﻨﯽ ﺑﺮ ﻣﻌﯿﺎر ‪F‬‬ ‫ﺑﻪ ﻣﺪل ﭘﯿﺸﮕﻮﯾﯽ ﺧﻄﺎي ﻧﺮم اﻓﺰار ﻣﺒﺘﻨﯽ ﺑﺮ ‪ AUC‬ﮐﺎراﯾﯽ ﺑﻬﺘﺮي را در ﻫﺮ‬
‫ﻣﺠﻤﻮﻋﻪ‬ ‫‪P‬ﻓﺮﺿﯿﻪﻫﺎ و ﻣﻘﺪار‬
‫ﻧﺘﺎﯾﺞ‬
‫ﺳﻪ ﮔﺮوه از ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ و ﻃﺮاﺣﯽ و ﺗﺮﮐﯿﺐ آن دو اراﺋﻪ ﮐﺮده اﺳﺖ‪.‬‬
‫ﮐﺪ ‪-‬ﻫﻤﻪ‬ ‫ﻃﺮاﺣﯽ ‪-‬ﻫﻤﻪ‬ ‫ﻃﺮاﺣﯽ ‪-‬ﮐﺪ‬
‫‪KC1‬‬ ‫‪0/416,H0‬‬ ‫‪0/043,H1‬‬ ‫‪0/043,H1‬‬ ‫ﻃﺮاﺣﯽ > ﮐﺪ = ﻫﻤﻪ‬ ‫ﺟﺪول ‪ : 1‬ﻣﺠﻤﻮﻋﻪﻫﺎي داده ‪NASA‬‬
‫ﮐﺪ = ﻫﻤﻪ‬
‫ﻣﺠﻤﻮﻋﻪ‬ ‫‪ %‬داﺷﺘﻦ ﺧﻄﺎ‬ ‫ﻣﺘﺮﯾﮏﻫﺎ‬
‫‪KC3‬‬ ‫‪0/223,H0‬‬ ‫‪0/08,H0‬‬ ‫‪0/043,H1‬‬ ‫ﻫﻤﻪ = ﻃﺮاﺣﯽ‬ ‫ﻣﺜﺎلﻫﺎ‬
‫داده‬ ‫ﻫﻤﻪ‬ ‫ﻃﺮاﺣﯽ‬ ‫ﮐﺪ‬
‫ﻃﺮاﺣﯽ> ﮐﺪ‬
‫‪CM1‬‬ ‫‪% 9/83‬‬ ‫‪505‬‬ ‫‪22‬‬ ‫‪5‬‬ ‫‪17‬‬
‫‪PC1‬‬ ‫‪0/273,H0‬‬ ‫‪0/043,H1‬‬ ‫‪0/043,H1‬‬ ‫ﻃﺮاﺣﯽ > ﮐﺪ = ﻫﻤﻪ‬
‫‪PC2‬‬ ‫‪0/317,H0‬‬ ‫‪0/655,H0‬‬ ‫‪0/317,H0‬‬ ‫ﻃﺮاﺣﯽ = ﮐﺪ = ﻫﻤﻪ‬ ‫‪KC1‬‬ ‫‪% 15/46‬‬ ‫‪2407‬‬ ‫‪22‬‬ ‫‪5‬‬ ‫‪17‬‬
‫‪PC3‬‬ ‫‪0/066,H0‬‬ ‫‪0/5,H0‬‬ ‫‪0/5,H0‬‬ ‫ﻃﺮاﺣﯽ = ﮐﺪ = ﻫﻤﻪ‬ ‫‪KC3‬‬ ‫‪% 9/39‬‬ ‫‪458‬‬ ‫‪40‬‬ ‫‪16‬‬ ‫‪20‬‬
‫‪PC4‬‬ ‫‪0/043,H1‬‬ ‫‪0/043,H1‬‬ ‫‪0/042,H1‬‬ ‫ﻃﺮاﺣﯽ>ﮐﺪ>ﻫﻤﻪ‬ ‫‪% 6/94‬‬
‫‪PC1‬‬ ‫‪1107‬‬ ‫‪22‬‬ ‫‪5‬‬ ‫‪17‬‬
‫ﻃﺮاﺣﯽ = ﮐﺪ‬
‫‪PC3‬‬ ‫‪%10/23‬‬ ‫‪1563‬‬ ‫‪38‬‬ ‫‪16‬‬ ‫‪20‬‬
‫‪PC5‬‬ ‫‪0/131,H0‬‬ ‫‪0/042,H1‬‬ ‫‪0/077,H0‬‬ ‫ﻃﺮاﺣﯽ > ﻫﻤﻪ‬
‫ﮐﺪ = ﻫﻤﻪ‬ ‫‪PC4‬‬ ‫‪% 12/2‬‬ ‫‪1458‬‬ ‫‪38‬‬ ‫‪16‬‬ ‫‪20‬‬
‫‪MC1‬‬ ‫‪0/414,H0‬‬ ‫‪0/715,H0‬‬ ‫‪0/461,H0‬‬ ‫ﻃﺮاﺣﯽ = ﮐﺪ = ﻫﻤﻪ‬ ‫‪% 7/69‬‬
‫‪MW1‬‬ ‫‪433‬‬ ‫‪38‬‬ ‫‪16‬‬ ‫‪20‬‬
‫‪MC2‬‬ ‫‪0/686,H0‬‬ ‫‪0/686,H0‬‬ ‫‪0/892,H0‬‬ ‫ﻃﺮاﺣﯽ = ﮐﺪ = ﻫﻤﻪ‬
‫‪MC2‬‬ ‫‪% 32/3‬‬ ‫‪161‬‬ ‫‪40‬‬ ‫‪16‬‬ ‫‪20‬‬
‫‪MW1‬‬ ‫‪0/066,H0‬‬ ‫‪0/138,H0‬‬ ‫‪0/042,H2‬‬ ‫ﻫﻤﻪ = ﻃﺮاﺣﯽ‬ ‫‪MC1‬‬ ‫‪% 0/72‬‬ ‫‪9466‬‬ ‫‪39‬‬ ‫‪15‬‬ ‫‪20‬‬
‫ﻃﺮاﺣﯽ < ﮐﺪ‬ ‫‪% 0/41‬‬
‫‪PC2‬‬ ‫‪5589‬‬ ‫‪37‬‬ ‫‪16‬‬ ‫‪19‬‬
‫‪CM1‬‬ ‫‪0/109,H0‬‬ ‫‪0/225,H0‬‬ ‫‪0/336,H0‬‬ ‫ﻃﺮاﺣﯽ = ﮐﺪ = ﻫﻤﻪ‬
‫‪PC5‬‬ ‫‪%3‬‬ ‫‪17186‬‬ ‫‪39‬‬ ‫‪15‬‬ ‫‪20‬‬
‫ﻃﺮاﺣﯽ = ﮐﺪ‬
‫‪KC2‬‬ ‫‪0/581,H0‬‬ ‫‪0/042,H1‬‬ ‫‪0/684,H0‬‬ ‫ﻃﺮاﺣﯽ > ﻫﻤﻪ‬ ‫‪KC2‬‬ ‫‪% 20/5‬‬ ‫‪522‬‬ ‫‪22‬‬ ‫‪5‬‬ ‫‪17‬‬
‫‪1‬‬
‫‪Message detailedness and import coupling‬‬
‫ ﻣﺘﺮﯾﮏﻫﺎي اﺳﺘﻔﺎده ﺷﺪه در اﯾﻦ ﻣﻘﺎﻟﻪ‬:2 ‫ﺟﺪول‬
‫ﮔﺮوه‬ ‫دﯾﮕﺮ‬
‫ﮐﺪ‬ ‫ﻃﺮاﺣﯽ‬
‫دﯾﮕﺮ‬
PARAMETER_COUNT EDGE_COUNT:e NORMALIZED_ CYCLOMATIC_COMPLEXITY
FORMAL PARAMETER NODE_COUNT:n GLOBAL_DATA_COMPLEXY:gdv(G)
NUM_OPERATORS:N1 BRANCH_COUNT GLOBAL_DATA_DENSITY
NUM_OPERANDS:N2 CALL_PAIRS CYCLOMATIC_DENSITY
CONDITION_COUNT
NUM_UNIQUE_OPERATORS: CYCLOMATIC_COMPLEXITY:v(G)
DECISION_COUNT
NUM_UNIQUE_OPERATORS:
DECISION_DENSITY
HALSTEAD_CONTENT: DESIGN_ COMPLEXITY:iv(G)
HALSTEAD_LENGTH:N DESIGN_DENSITY
HALSTEAD_LEVEL:L ESSENTIAL_ COMPLEXITY:ev(G)
‫ﻣﺘﺮﯾﮏﻫﺎ‬ ESSENTIAL_DENSITY
HALSTEAD_DIFFICULTY:D
HALSTEAD_VOLUME:V MAINTENANCE_SEVERITY
HALSTEAD_EFFORT:E MODIFIED_CONDITION_COUNT
HALSTEAD_PROG_TIME:T MULTIPLE_ CONDITION_COUNT
HALSTEAD_ERROR_EST:B PATHOLOGICAL_ COMPLEXITY
NUMBER_OF_LINES
LOC_BLANK
LOC_CODE_AND_COMMENT:NCSLOC
LOC_COMMENTS
LOC_EXECUTABLE
PERCENT_COMMENTS
LOC_TOTAL
‫ ﻣﺠﻤﻮﻋﻪ داده‬12 ‫ از‬AUC ‫ ﻧﻤﻮدارﻫﺎي ﺟﻌﺒﻪاي ﻣﺒﺘﻨﯽ ﺑﺮ‬:1 ‫ﺷﮑﻞ‬
AUC ‫ ﻣﺒﺘﻨﯽ ﺑﺮ‬NASA ‫ ﻧﺘﺎﯾﺞ ﺗﺴﺖ ﻓﺮﯾﺪﻣﻦ روي ﻣﺠﻤﻮﻋﻪ دادهﻫﺎي‬: 4 ‫ﺟﺪول‬
KC2 CM1 MW1 MC2 MC1 PC5 PC4 PC3 PC2 PC1 KC3 KC1 ‫ﻣﺠﻤﻮﻋﻪ‬
٠/١٦٥ ٠/٠١٥ ٠/٣٣١ ٠/٠٢٢ ٠/٠١٥ ٠/٢٤٧ ٠/٠٠٧ ٠/٠٢٢ ٠/٠١٥ ٠/٠١٥ ٠/٠١٥ ٠/٠٢٢ P ‫ﻓﺮﻳﺪﻣﻦ‬
F ‫ ﻣﺒﺘﻨﯽ ﺑﺮ ﻣﻌﯿﺎر‬NASA ‫ﻧﺘﺎﯾﺞ ﺗﺴﺖ ﻓﺮﯾﺪﻣﻦ روي ﻣﺠﻤﻮﻋﻪ دادهﻫﺎي‬. :6 ‫ﺟﺪول‬
KC2 CM1 MW1 MC2 MC1 PC5 PC4 PC3 PC2 PC1 KC3 KC1 ‫ﻣﺠﻤﻮﻋﻪ‬
٠/١٩٦ ٠/١٣٥ ٠/٠٢١ ٠/٨١٩ ٠/٥٤٩ ٠/٠٤١ ٠/٠٠٧ ٠/١٠٤ ٠/٦٠٧ ٠/٠١٦ ٠/٠٧٤ ٠/٠٢٢ P ‫ﻓﺮﻳﺪﻣﻦ‬
‫ ﻣﺠﻤﻮﻋﻪ داده‬12 ‫ از‬F ‫ ﻧﻤﻮدارﻫﺎي ﺟﻌﺒﻪاي ﻣﺒﺘﻨﯽ ﺑﺮ ﻣﻌﯿﺎر‬:2 ‫ﺷﮑﻞ‬
‫ﻣﻨﺎﺑﻊ‬
[9] M. Chapman, P. Callis, W. Jackson, Metrics Data Program, [1] N. Ohlsson, M. Helander, C. Wohlin, "Quality improvement
NASA IV and V Facility, http://mdp.ivv.nasa.gov/, 2004. by identification of fault-prone modul using software design
[10] Metric data program. NASA Independent Verification and metrics", Proc, 6th International Conference on Software
Validation facility, Available from http://MDP.ivv.nasa.gov. Quality, pp. 1–13, Ottawa, Canada, 1996.
[11] U. of Waikato. Weka software package. The University of [2] W. Gibbs, Software’s chronic crisis, Scientific American, 86–
Waikato, available http://www.cs.waikato.ac.nz/ml/weka/. 94, September (1994).
[12] J. Demsar, "Statistical comparisons of classifiers over multiple [3] I, Sommerville, Software Engineering, Addison-Wesley,
data sets", Journal of Machine Learning Research, 7, 2006. Reading, MA, 1996.
[13] SPSS Statistics 19.0.0 [4] F. Shull, V. B. ad B, Boehm, A. Brown, P. Costa, M. Lindvall,
D. Port, I. Rus, R. Tesoriero, M. Zelkowitz, "What we have
learned about fighting defects", in Proceedings of 8th
1
8 to 20 LOC/minute International Software Metrics Symposium, pp. 249–258,
2
boxplot Ottawa, Canada, 2002. available from
3
Area under the curve http://fcmd.umd.edu/fcmd/Papers/shull defects.ps.
4
F-measure [5] R.W. SELBY, A.A. PORTER, "SOFTWARE METRIC CLASSIFICATION
5
DEFECT TREES HELP GUIDE THE MAINTENANCE OF LARGE-SCALE SYSTEM",
6
Machin learning SOFTWARE MAINTENANCE, 1989., PROCEEDINGS., CONFERENCE
7
Receiver operating characteristic ON, PP. 116–123, MIAMI, FL, USA, 1989.
8
Friedman [6] M. Zhao, C. Wohlin, N. Ohlsson, and M. Xie. "A comparison
9 between software design and code metrics for the prediction of
Wilcoxon
10
P-value software fault content" Information and Software Technology,
40(14) :801–809, 1998.
[7] Y. Jiang, B. Cuki, T. Menzies, and N. Bartlow. "Comparing
design and code metrics for software quality prediction", In
Proceedings of the 4th international workshop on Predictor
models in software engineering, pages 11–18. ACM
NewYork, NY, USA, 2008.
[8] A. Nugroho, M.r.v. Chaudron, E. Arisholm, "Assessing UML
Design Metrics for Predicting Fault-prone Classes in a Java
System", IEEE, PP. 21-30, 2010.

1106 اسلامی

Uploaded by

Document Information

Original Title

Copyright

Available Formats

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Copyright:

Available Formats

1106 اسلامی

Uploaded by

Copyright:

Available Formats

‫ﺗﺄﺛﯿﺮ ﻣﺘﺮﯾﮏﻫﺎي ﻃﺮاﺣﯽ ﻧﺴﺒﺖ ﺑﻪ ﻣﺘﺮﯾﮏ ﻫﺎي ﮐﺪ در ﺑﻬﺒﻮد ﮐﺎراﯾﯽ‬

‫ﺳﺎﻣﺎﻧﻪﻫﺎي ﺗﺴﺖ اﺗﻮﻣﺎﺗﯿﮏ‬

‫ﻣﺪﻟﯽ اﺳﺖ ﮐﻪ از ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ اﺳﺘﻔﺎده ﻣﯽﮐﻨﺪ و ﭘﯿﺸﺮﻓﺖ ﻣﻬﻤﯽ وﺟﻮد‬

‫ ﻣﺠﻤﻮﻋﻪ داده‬12 ‫ از‬AUC ‫ ﻧﻤﻮدارﻫﺎي ﺟﻌﺒﻪاي ﻣﺒﺘﻨﯽ ﺑﺮ‬:1 ‫ﺷﮑﻞ‬

F ‫ ﻣﺒﺘﻨﯽ ﺑﺮ ﻣﻌﯿﺎر‬NASA ‫ﻧﺘﺎﯾﺞ ﺗﺴﺖ ﻓﺮﯾﺪﻣﻦ روي ﻣﺠﻤﻮﻋﻪ دادهﻫﺎي‬. :6 ‫ﺟﺪول‬

You might also like