Professional Documents
Culture Documents
1106 اسلامی
1106 اسلامی
در ﯾﮏ دﻗﯿﻘﻪ 1ﺑﺎزرﺳﯽ ﮐﻨﺪ واﺿﺢ اﺳﺖ ﮐﻪ ﭼﺮا ﭘﯿﺸﮕﻮﯾﯽﻫﺎي اﺗﻮﻣﺎﺗﯿﮏ ﺧﻄﺎ ﭼﮑﯿﺪه -ﭘﯿﺸﮕﻮﯾﯽ اﺗﻮﻣﺎﺗﯿﮏ ﺧﻄﺎ ﺑﺮ اﺳﺎس ﻣﺘﺮﯾﮏ ﻫﺎي ﻣﻮﺟﻮد در ﭘﺮوژه ﯾﮑﯽ از
ﻣﺒﺎﺣﺚ ﻣﻮرد ﺗﻮﺟﻪ ﺑﺮاي اﻓﺰاﯾﺶ ﮐﯿﻔﯿﺖ ﻧﺮم اﻓﺰار اﺳﺖ .ﺑﺎ وﺟﻮد اﺳﺘﻔﺎده زﯾﺎد از
ﺑﺮ اﺳﺎس ﻣﺘﺮﯾﮏ ﻫﺎي ﻣﻮﺟﻮد در ﭘﺮوژه ،اﯾﻦ ﭼﻨﯿﻦ ﻣﻮرد ﺗﻮﺟﻪ ﺗﻮﻟﯿﺪ ﮐﻨﻨﺪﮔﺎن
ﻣﺘﺮﯾﮏ ﻫﺎي ﮐﺪ در ﻣﻄﺎﻟﻌﺎت ﮔﺬﺷﺘﻪ ،ﺗﻨﻬﺎ ﺳﻪ ﻣﻄﺎﻟﻌﻪ دﯾﺪه ﺷﺪه ﮐﻪ ﺗﺎﺛﯿﺮ ﻣﺘﺮﯾﮏﻫﺎي
ﻧﺮم اﻓﺰار اﺳﺖ .از اﯾﻨﺮو ﻣﻬﻨﺪﺳﯿﻦ ﻧﺮم اﻓﺰار ﺑﻪ ﺳﺎﺧﺖ ﺳﺎﻣﺎﻧﻪ ﻫﺎﯾﯽ رو آوردﻧﺪ
ﮐﺪ و ﻣﺘﺮﯾﮏ ﻫﺎي ﻃﺮاﺣﯽ را در ﭘﯿﺸﮕﻮﯾﯽ ﺧﻄﺎي ﻧﺮم اﻓﺰار ﻣﻘﺎﯾﺴﻪ ﻣﯽﮐﻨﺪ و ﻧﺘﺎﯾﺞ
ﮐﻪ ﺑﺮ اﺳﺎس روش ﻫﺎي داده ﮐﺎوي ،ﻓﺎﯾﻞ ﻫﺎي ﻣﺸﮑﻮك را ﺷﻨﺎﺳﺎﯾﯽ ﻣﯽ ﻣﺘﻨﺎﻗﻀﯽ ﻫﻢ دارﻧﺪ .در اﯾﻦ ﻣﻄﺎﻟﻌﻪ ﺑﻪ ﻣﻨﻈﻮر درك ﺑﻬﺘﺮ و واﻗﻊ ﺑﯿﻨﺎﻧﻪ ﺗﺮ ﺗﺄﺛﯿﺮ
ﮐﻨﻨﺪ و در ﻧﺘﯿﺠﻪ ﺑﺎﻋﺚ ﺑﺎﻻ رﻓﺘﻦ ﮐﯿﻔﯿﺖ ﻧﺮم اﻓﺰار ،رﺿﺎﯾﺖ ﻣﺸﺘﺮي و ﮐﺎﻫﺶ ﻣﺘﺮﯾﮏﻫﺎي ﻃﺮاﺣﯽ ﻧﺴﺒﺖ ﺑﻪ ﻣﺘﺮﯾﮏ ﻫﺎي ﮐﺪ ،از آزﻣﺎﯾﺸﺎت ﻣﺘﻨﻮع ﺗﺮي اﺳﺘﻔﺎده ﺷﺪه
ﻫﺰﯾﻨﻪ ﻣﯽ ﺷﻮد .اوﻟﯿﻦ ﮐﺎر داده ﮐﺎوي ﺗﻮﺳﻂ ﺳﻠﺒﯽ و ﭘﻮرﺗﺮ ] [5ﺑﺮ اﺳﺎس اﺳﺖ .ﺑﻪ وﺳﯿﻠﻪ ﭼﻨﺪ ﺗﮑﻨﯿﮏ ﻣﺪل ﺳﺎزي ،ﻣﺪلﻫﺎي ﭘﯿﺸﮕﻮﯾﯽ ﺧﻄﺎ ﻣﺒﺘﻨﯽ ﺑﺮ ﻣﺘﺮﯾﮏ ﮐﺪ
و ﻣﺘﺮﯾﮏ ﻃﺮاﺣﯽ و ﺗﺮﮐﯿﺐ آن دو ﺑﺮاي ﺷﻨﺎﺳﺎﯾﯽ ﻣﺎژولﻫﺎي داراي ﺧﻄﺎ ﺳﺎﺧﺘﻪ ﺷﺪه
ﻣﺘﺮﯾﮏ ﻫﺎي ﮐﺪ ﺑﻮده اﺳﺖ و ﭘﺲ از آن ﻧﯿﺰ ﺑﻪ ﻣﺘﺮﯾﮏ ﻫﺎي ﮐﺪ ﺗﻮﺟﻪ زﯾﺎدي
اﺳﺖ و ﮐﺎراﯾﯽ دﺳﺘﻪ ﺑﻨﺪي ﻫﺎي ﻣﺨﺘﻠﻒ را ﺑﺎ اﻧﺪازه ﮔﯿﺮي ﺳﻄﺢ زﯾﺮ ﻣﻨﺤﻨﯽ و ﻣﻌﯿﺎر F
ﺷﺪه اﺳﺖ وﻟﯽ ﭼﻮن ﻣﺘﺮﯾﮏ ﻫﺎي ﻃﺮاﺣﯽ در ﻣﻘﺎﯾﺴﻪ ﺑﺎ ﻣﺘﺮﯾﮏ ﻫﺎي ﮐﺪ آن ﻫﺎ ارزﯾﺎﺑﯽ ﻣﯽ ﮐﻨﯿﻢ .ﺑﺮ اﺳﺎس ﺗﺴﺖﻫﺎي آﻣﺎري ،درﮐﺎراﯾﯽ ﻣﺪلﻫﺎﯾﯽ ﮐﻪ از ﺗﺮﮐﯿﺐ
ﻣﻤﮑﻦ اﺳﺖ ﺑﻪ روز ﻧﺒﺎﺷﻨﺪ ﺑﻨﺎﺑﺮاﯾﻦ دﻗﺖ ﻣﺘﺮﯾﮏ ﻫﺎي ﮐﺪ را در ﻧﺮم اﻓﺰار ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ و ﻃﺮاﺣﯽ اﺳﺘﻔﺎده ﻣﯽﮐﻨﻨﺪ در ﻣﻘﺎﯾﺴﻪ ﺑﺎ آنﻫﺎﯾﯽ ﮐﻪ از ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ
ﻧﺪارﻧﺪ .ﺗﻨﻬﺎ در ﺳﻪ ﻣﻄﺎﻟﻌﻪ ﮐﺎراﯾﯽ ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ و ﻣﺘﺮﯾﮏ ﻫﺎي ﻃﺮاﺣﯽ و اﺳﺘﻔﺎده ﻣﯽﮐﻨﻨﺪ ﭘﯿﺸﺮﻓﺖ ﻗﺎﺑﻞ ﺗﻮﺟﻬﯽ وﺟﻮد ﻧﺪارد ،ﻫﻤﭽﻨﯿﻦ ﻣﺘﺮﯾﮏﻫﺎي ﻃﺮاﺣﯽ
ﻧﺴﺒﺖ ﺑﻪ ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ و ﯾﺎ ﺗﺮﮐﯿﺐ ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ و ﻃﺮاﺣﯽ ﺗﺄﺛﯿﺮ ﮐﻤﺘﺮي در
ﺗﺮﮐﯿﺐ آن دو در ﭘﯿﺸﮕﻮﯾﯽ ﺧﻄﺎي ﻧﺮم اﻓﺰار ﻣﻘﺎﯾﺴﻪ ﺷﺪه و ﻧﺘﺎﯾﺞ ﺑﻪ دﺳﺖ
ﺷﻨﺎﺳﺎﯾﯽ ﻣﺎژول ﻫﺎي داراي ﺧﻄﺎ دارد.
آﻣﺪه از آﻧﻬﺎ ﻫﻢ ﻣﺘﻨﺎﻗﺾ اﺳﺖ] 6و 7و . [8در ﻧﺘﺎﯾﺞ اوﻟﯿﻦ ﻣﻄﺎﻟﻌﻪ ﻣﺸﺎﻫﺪه
ﺷﺪه ﮐﻪ ﻣﺪل ﭘﯿﺸﮕﻮﯾﯽ ﮐﻪ از ﻣﺘﺮﯾﮏﻫﺎي ﻃﺮاﺣﯽ اﺳﺘﻔﺎده ﻣﯽﮐﻨﺪ ﺑﻪ ﺧﻮﺑﯽ ﮐﻠﯿﺪ واژه :ﻣﺘﺮﯾﮏ ﻃﺮاﺣﯽ ،ﻣﺘﺮﯾﮏ ﮐﺪ ،ﭘﯿﺸﮕﻮﯾﯽ ﺧﻄﺎ ،داده ﮐﺎوي
12ﻣﺠﻤﻮﻋﻪ داده NASAﻓﺮاﺧﻮاﻧﯽ ﺷﺪه و از 5اﻟﮕﻮرﯾﺘﻢ دﺳﺘﻪ ﺑﻨﺪي 6در ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ اﯾﺴﺘﺎ -2ﻓﻘﻂ ﻣﺘﺮﯾﮏﻫﺎي ﻃﺮاﺣﯽ -3ﺗﺮﮐﯿﺒﯽ از
[11]WEKAﮐﻪ در ﺟﺪول 3ﻧﺸﺎن داده ﺷﺪه ﺳﺎﺧﺘﻪ ﺷﺪه اﺳﺖ ﺑﺮاي ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ اﯾﺴﺘﺎ و ﻣﺘﺮﯾﮏﻫﺎي ﺳﻄﺢ ﻃﺮاﺣﯽ ﻧﺸﺎن ﻣﯽدﻫﯿﻢ.
ﺳﺎﺧﺖ ﻣﺪل ﭘﯿﺸﮕﻮﯾﯽ ﺧﻄﺎ اﺳﺘﻔﺎده ﺷﺪه اﺳﺖ )ﺟﻨﮕﻞﻫﺎي ﺗﺼﺎدﻓﯽ ﺑﺎ 500 ﻧﺘﺎﯾﺞ ﺣﺎﺻﻞ ﺑﻪ ﺻﻮرت زﯾﺮ اﺳﺖ (1 :ﻣﺪلﻫﺎي ﺳﺎﺧﺘﻪ ﺷﺪه ﺑﺎ اﺳﺘﻔﺎده از
درﺧﺖ رﺷﺪ ﯾﺎﻓﺘﻪ( .ﮐﺎراﯾﯽ ﻣﺪلﻫﺎ ﯾﮏ ﺑﺎرﺑﺮ ﻣﺒﻨﺎي ﻣﻨﺤﻨﯽ 7 ROCو ﻣﻨﻄﻘﻪ ﻣﺘﺮﯾﮏﻫﺎي ﻃﺮاﺣﯽ و ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ اﯾﺴﺘﺎ و ﺗﺮﮐﯿﺐ ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ و
زﯾﺮ ﻣﻨﺤﻨﯽ ) (AUCو ﯾﮏ ﺑﺎر ﺑﺮ ﻣﺒﻨﺎي ﻣﻌﯿﺎر Fارزﯾﺎﺑﯽ ﺷﺪه اﺳﺖ .از ﻃﺮاﺣﯽ ﻣﻔﯿﺪﻧﺪ؛ (2ﺑﺎ ﺗﻮﺟﻪ ﺑﻪ ﻧﻤﻮدارﻫﺎي ﺟﻌﺒﻪاي 2و ﺗﺴﺖﻫﺎي آﻣﺎري،
ﻧﻤﻮدارﻫﺎي ﺟﻌﺒﻪاي ﺟﻬﺖ ﻧﻤﺎﯾﺶ ﮔﺮاﻓﯿﮑﯽ ﮐﺎراﯾﯽ ﻣﺪلﻫﺎ اﺳﺘﻔﺎده ﻣﯽﺷﻮد .ﻣﺎ ﮐﺎراﯾﯽ ﻣﺘﺮﯾﮏﻫﺎي ﻃﺮاﺣﯽ در ﭘﯿﺸﮕﻮﯾﯽ ﺧﻄﺎي ﻧﺮم اﻓﺰار ﻧﺴﺒﺖ ﺑﻪ
ﮐﺎراﯾﯽ ﻣﺪلﻫﺎي ﺳﺎﺧﺘﻪ ﺷﺪه از ﻣﺘﺮﯾﮏﻫﺎ در ﺳﻪ ﮔﺮوه ﻃﺮاﺣﯽ و ﮐﺪ و ﻫﻤﻪ را ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ و ﺗﺮﮐﯿﺐ آن دو ﺿﻌﯿﻒﺗﺮ اﺳﺖ؛ (3ﻣﺪل ﭘﯿﺸﮕﻮﯾﯽ ﺧﻄﺎي
ﺑﺎ ﻫﻢ ﻣﻘﺎﯾﺴﻪ ﻣﯽﮐﻨﯿﻢ. ﻧﺮم اﻓﺰار ﻣﺒﺘﻨﯽ ﺑﺮ ﻣﻌﯿﺎر Fﻧﺴﺒﺖ ﺑﻪ ﻣﺪل ﭘﯿﺸﮕﻮﯾﯽ ﺧﻄﺎي ﻧﺮم اﻓﺰار ﻣﺒﺘﻨﯽ
ﺳﭙﺲ از ﺗﺴﺖﻫﺎي آﻣﺎري ﻏﯿﺮ ﭘﺎراﻣﺘﺮي دﻣﺴﺎر] [12ﺑﺮاي ﻣﻘﺎﯾﺴﻪ ﮐﺎراﯾﯽ ﺑﺮ 3AUCﮐﺎراﯾﯽ ﺑﻬﺘﺮي را روي ﺳﻪ ﮔﺮوه از ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ و ﻃﺮاﺣﯽ و
ﻣﺪلﻫﺎي ﺑﻪ وﺟﻮد آﻣﺪه از ﺳﻪ ﮔﺮوه ﻣﺘﺮﯾﮏ ﮐﺪ و ﻃﺮاﺣﯽ و ﺗﺮﮐﯿﺐ آن دو در ﺗﺮﮐﯿﺐ ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ و ﻃﺮاﺣﯽ اراﺋﻪ ﮐﺮده اﺳﺖ.
ﻣﺪلﻫﺎي ﻣﺒﺘﻨﯽ ﺑﺮ AUCو ﻫﻤﭽﻨﯿﻦ ﺑﻪ ﻃﻮر ﺟﺪاﮔﺎﻧﻪ در ﻣﺪلﻫﺎي ﻣﺒﺘﻨﯽ ﺑﺮ ﺳﺎﺧﺘﺎر ﻣﻘﺎﻟﻪ ﺷﺎﻣﻞ ﻣﻮارد زﯾﺮ ﻣﯽ ﺑﺎﺷﺪ :در ﺑﺨﺶ دوم ﭘﺮوژه ﻫﺎ و
ﻣﻌﯿﺎر Fاﺳﺘﻔﺎده ﺷﺪه اﺳﺖ .اﯾﻦ ﺗﺴﺖ در دو ﻣﺮﺣﻠﻪ اﻧﺠﺎم ﻣﯽﮔﯿﺮد. ﻣﺘﺮﯾﮏﻫﺎي ﻧﺮم اﻓﺰار ﺑﺮرﺳﯽ ﺷﺪه اﺳﺖ .در ﺑﺨﺶ ﺳﻮم ﻃﺮاﺣﯽ آزﻣﺎﯾﺸﯽ
اﺑﺘﺪا از ﺗﺴﺖ ﻓﺮﯾﺪﻣﻦ 8ﺑﺮاي ﻣﻘﺎﯾﺴﻪ ﺳﻪ ﮔﺮوه ﻣﺘﺮﯾﮏﻫﺎ ﺑﺎ ﻫﻢ در ﻫﺮ ﺑﺮاي ﺳﺎﺧﺖ ﻣﺪل ﭘﯿﺸﮕﻮي ﺧﻄﺎي ﻧﺮم اﻓﺰار ﺑﺎ اﻧﺘﺨﺎب ﺗﮑﻨﯿﮏﻫﺎي
ﻣﺠﻤﻮﻋﻪ داده اﺳﺘﻔﺎده ﻣﯽﺷﻮد و در ﺻﻮرﺗﯽ ﮐﻪ اﺧﺘﻼف ﻗﺎﺑﻞ ﺗﻮﺟﻬﯽ ﺑﯿﻦ ﻣﺪلﺳﺎزي اﻧﺠﺎم ﻣﯽﺷﻮد .ﺑﺨﺶ ﭼﻬﺎرم ﺷﺎﻣﻞ اراﺋﻪ ﻧﺘﺎﯾﺞ ﺗﺠﺮﺑﯽ و ﺑﺤﺚ روي
ﮐﺎراﯾﯽ اﯾﻦ ﺳﻪ ﮔﺮوه وﺟﻮد داﺷﺘﻪ ﺑﺎﺷﺪ از ﺗﺴﺖ وﯾﻠﮑﺎﮐﺴﻮن 9ﺑﺮاي ﻣﻘﺎﯾﺴﻪ دو ﭘﯿﺎده ﺳﺎزي ﻣﺪلﻫﺎي ﭘﯿﺸﮕﻮﯾﯽ ﺧﻄﺎ ﻣﺒﺘﻨﯽ ﺑﺮ AUCو ﻣﺪلﻫﺎي ﻣﺒﺘﻨﯽ ﺑﺮ
ﺑﻪ دو از ﻣﺪلﻫﺎي ﺑﻪ وﺟﻮد آﻣﺪه ازﺳﻪ ﮔﺮوه ﻣﺘﺮﯾﮏﻫﺎ در ﻫﺮ ﻣﺠﻤﻮﻋﻪ داده ﻣﻌﯿﺎر 4Fاﺳﺖ و ﮐﺎراﯾﯽ آنﻫﺎ ﻣﻘﺎﯾﺴﻪ ﺷﺪه اﺳﺖ .ﺑﺨﺶ ﭘﻨﺠﻢ ،ﮐﺎرﻫﺎي
اﺳﺘﻔﺎده ﻣﯽﺷﻮد .از آﻧﺠﺎﺋﯿﮑﻪ در ﮔﺮوه ﻫﻤﻪ ،ﺗﻮزﯾﻊ ﻏﯿﺮ ﻧﺮﻣﺎل دارﯾﻢ ﻫﺮ ﭼﻨﺪ در ﻣﺮﺗﺒﻂ ﭘﯿﺸﯿﻦ و ﺑﺨﺶ ﺷﺸﻢ ﺑﻪ ﺟﻤﻊﺑﻨﺪي و ﻧﺘﯿﺠﻪﮔﯿﺮي اﺧﺘﺼﺎص ﯾﺎﻓﺘﻪ
ﮐﺪ و ﻃﺮاﺣﯽ ﺗﻮزﯾﻊ ﻧﺮﻣﺎل اﺳﺖ وﻟﯽ ﻣﺠﺒﻮرﯾﻢ از ﺗﺴﺖﻫﺎي ﻏﯿﺮ ﭘﺎراﻣﺘﺮي اﺳﺖ.
اﺳﺘﻔﺎده ﮐﻨﯿﻢ ،ﻓﺮض ﻣﯽﺷﻮد ﮐﻪ دو ﻣﺪل Mو Nاز ﻣﺘﺮﯾﮏﻫﺎي ﻣﺨﺘﻠﻒ ﺑﺎ 5
-2ﻣﺠﻤﻮﻋﻪ ﻫﺎي داده و ﻣﺘﺮﯾﮏﻫﺎ
ﺗﮑﻨﯿﮏ ﻣﺪل ﺳﺎزي در ﯾﮏ ﻣﺠﻤﻮﻋﻪ داده دارﯾﻢ و ﻣﯽﺧﻮاﻫﯿﻢ ﺑﻬﺘﺮﯾﻦ ﻣﺪل را
دوازده ﻣﺠﻤﻮﻋﻪ داده اﺳﺘﻔﺎده ﺷﺪه در اﯾﻦ ﻣﻄﺎﻟﻌﻪ از اﻧﺒﺎره داده ﻣﺠﻤﻮﻋﻪ
از ﺑﯿﻦ دو ﻣﺪل Mو Nاﻧﺘﺨﺎب ﮐﻨﯿﻢ .ﻓﺮﺿﯿﻪﻫﺎي ﺗﺴﺖ آﻣﺎري ﻣﻨﺎﺳﺐ
ﻓﻀﺎﯾﯽ آﻣﺮﯾﮑﺎ NASAاﺳﺖ ] [10ﮐﻪ در ﺟﺪول 1ﻧﺸﺎن داده ﺷﺪه اﺳﺖ.
ﻋﺒﺎرﺗﻨﺪ از :
اﯾﻦ ﻣﺠﻤﻮﻋﻪﻫﺎي داده ﮐﻪ در اﻧﺒﺎره داده ﭘﺮاﻣﯿﺲ ﻫﻢ در دﺳﺘﺮس ﻫﺴﺘﻨﺪ ﺑﻪ
: H0ﻫﯿﭻ اﺧﺘﻼﻓﯽ در ﮐﺎراﯾﯽ ﻣﺪلﻫﺎﯾﯽ ﮐﻪ از ﻣﺘﺮﯾﮏﻫﺎي ﮔﺮوه Mﯾﺎ N
١٠ ﻣﺘﺮﯾﮏﻫﺎي ﻣﺎژوﻟﯽ اﺷﺎره ﻣﯽﮐﻨﻨﺪ ﮐﻪ 12ﭘﺮوژه ﮔﻮﻧﺎﮔﻮن از NASAرا
ﺗﺮ (٠/٠٥ p اﺳﺘﻔﺎده ﻣﯽﮐﻨﻨﺪ وﺟﻮد ﻧﺪارد) .د
ﺗﻮﺻﯿﻒ ﻣﯽﮐﻨﺪ .در اﯾﻦ ﭘﺮوژه ﻫﺎ ،ﯾﮏ ﻣﺸﺨﺼﻪ دودوﯾﯽ ﮐﻪ ﻣﺘﻐﯿﺮ ﭘﯿﺸﮕﻮﯾﯽ
:H1ﮐﺎراﯾﯽ ﻣﺪل ﮔﺮوه Mاز ﮐﺎراﯾﯽ ﻣﺪل ﮔﺮوه Nﺑﻬﺘﺮ اﺳﺖ.
ﺷﺪه اﺳﺖ و ﺧﻂ5ا ﻧﺎﻣﯿﺪه ﻣﯽﺷﻮد وﺟﻮد دارد.
: H2ﮐﺎراﯾﯽ ﻣﺪل ﮔﺮوه Mاز ﮐﺎراﯾﯽ ﻣﺪل ﮔﺮوه Nﺑﺪﺗﺮ اﺳﺖ.
در اﯾﻦ ﻣﻄﺎﻟﻌﻪ ﻃﺒﻖ ﻣﻌﯿﺎر ﺗﻘﺴﯿﻢ ﺑﻨﺪي ﺟﯿﺎن و ﻫﻤﮑﺎران ][7ﺳﻪ ﮔﺮوه
ﺗﺮﺳﯿﻢ ﻧﻤﻮدارﻫﺎي ﺟﻌﺒﻪاي و اﻧﺠﺎم ﺗﺴﺖﻫﺎي آﻣﺎري ﺑﻪ وﺳﯿﻠﻪ ﻧﺮم اﻓﺰار
ﻣﺘﺮﯾﮏ ﺑﺮاي ﻫﺮ ﻣﺎژول در ﻧﻈﺮ ﮔﺮﻓﺘﻪ ﺷﺪه ﮐﻪ در ﺟﺪول 2ﻣﻮﺟﻮداﺳﺖ و
SPSSاﻧﺠﺎم ﺷﺪه اﺳﺖ].[13
ﺷﺎﻣﻞ ﻣﺘﺮﯾﮏ ﻫﺎي ﻃﺮاﺣﯽ و ﻣﺘﺮﯾﮏ ﻫﺎي ﮐﺪ و ﻣﺘﺮﯾﮏﻫﺎي دﯾﮕﺮﻣﯽ ﺑﺎﺷﺪ.
-4ﻧﺘﺎﯾﺞ ﺗﺠﺮﺑﯽ ﻣﺘﺮﯾﮏﻫﺎي دﯾﮕﺮ ،ﻫﻢ ﺑﺎ ﻃﺮاﺣﯽ و ﻫﻢ ﺑﺎ ﮐﺪ ﻣﺮﺑﻮط ﻣﯽﺷﻮﻧﺪ .ﺑﻌﻀﯽ
در اﯾﻦ ﺑﺨﺶ ﻣﺎ ﻧﺘﺎﯾﺞ آزﻣﺎﯾﺸﺎت اﻧﺠﺎم ﺷﺪه را ﮐﻪ ﺷﺎﻣﻞ ﻧﻤﻮدارﻫﺎي ﺟﻌﺒﻪاي ﻣﺠﻤﻮﻋﻪﻫﺎي داده ﻣﺜﻞ 4 ،PC5ﻣﺘﺮﯾﮏ دارﻧﺪ ﮐﻪ ﻣﺎ آنﻫﺎ را در ﺳﺘﻮن دﯾﮕﺮ
و ﺗﺴﺖﻫﺎي آﻣﺎري اﺳﺖ ﯾﮏ ﺑﺎر ﺑﺮ ﻣﺒﻨﺎي AUCو ﯾﮏ ﺑﺎر ﺑﺮ ﻣﺒﻨﺎي ﻣﻌﯿﺎر دﺳﺘﻪ ﺑﻨﺪي ﮐﺮدهاﯾﻢ .ﺑﻌﻀﯽ از ﻣﺠﻤﻮﻋﻪﻫﺎي داده ﻣﺜﻞ CM1ﻫﯿﭻ ﻣﺘﺮﯾﮑﯽ
Fاراﺋﻪ ﻣﯽ ﺷﻮد و ﺳﭙﺲ ﻣﻘﺎﯾﺴﻪاي ﺑﯿﻦ ﻣﺪل ﻫﺎ اﻧﺠﺎم ﻣﯽ ﺷﻮد. ﺟﺰء دﯾﮕﺮ ﻧﺪارﻧﺪ .ﺑﻪ ﻋﻼوه ﻣﺎ ﯾﮏ ﮔﺮوﻫﯽ را ﮐﻪ ﻫﻤﻪ ﻧﺎﻣﯿﺪه ﻣﯽﺷﻮد ﺗﻌﺮﯾﻒ
ﻣﯽﮐﻨﯿﻢ ﮐﻪ ﺷﺎﻣﻞ ﻣﺠﻤﻮﻋﻪ ﮐﺎﻣﻠﯽ از ﻣﺘﺮﯾﮏﻫﺎي ﻣﺎژول اﺳﺖ.
-1- 4ﻧﺘﺎﯾﺞ ﺗﺠﺮﺑﯽ ﻣﺒﺘﻨﯽ ﺑﺮ AUC
در 3ﻣﻮرد ﮐﺎراﯾﯽ ﻣﺪلﻫﺎي ﺳﺎﺧﺘﻪ ﺷﺪه از ﮔﺮوه ﻣﺘﺮﯾﮏ ﻃﺮاﺣﯽ ﮐﻢﺗﺮﯾﻦ -1-1-4ﻧﻤﻮدارﻫﺎي ﺟﻌﺒﻪاي ﻣﺒﺘﻨﯽ ﺑﺮ AUC
اﺳﺖ. ﺷﮑﻞ 1ﻧﻤﻮدارﻫﺎي ﺟﻌﺒﻪاي ﺑﺮاي AUCاز 12ﻣﺠﻤﻮﻋﻪ داده دﯾﮕﺮ را ﻧﺸﺎن
-3-4ﻣﻘﺎﯾﺴﻪ ﻣﺪل ﻫﺎ ﻣﯽدﻫﺪ .از اﯾﻦ ﻧﻤﻮدارﻫﺎي ﺟﻌﺒﻪاي روﻧﺪ زﯾﺮ ﻣﺸﺎﻫﺪه ﻣﯽ ﺷﻮد.
در ﮐﺎراﯾﯽ ﻣﺪلﻫﺎﯾﯽ ﮐﻪ از ﺗﺮﮐﯿﺐ ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ و ﻃﺮاﺣﯽ اﺳﺘﻔﺎده
ﻣﻘﺎﯾﺴﻪ ﺑﯿﻦ ﻣﺪلﻫﺎي ﭘﯿﺸﮕﻮﯾﯽ ﺧﻄﺎي ﻧﺮم اﻓﺰار ﻣﺒﺘﻨﯽ ﺑﺮ AUCو ﻣﺒﺘﻨﯽ ﺑﺮ
ﻣﯽﮐﻨﻨﺪ ﻧﺴﺒﺖ ﺑﻪ ﻣﺪلﻫﺎﯾﯽ ﮐﻪ از ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ اﺳﺘﻔﺎده ﻣﯽﮐﻨﻨﺪ
ﻣﻌﯿﺎر Fﺑﺎ ﻣﻘﺎﯾﺴﻪ ﻧﻤﻮدارﻫﺎي ﺟﻌﺒﻪاي آنﻫﺎ روي ﻣﺠﻤﻮﻋﻪﻫﺎي داده ﯾﮑﺴﺎن
ﭘﯿﺸﺮﻓﺖ ﻗﺎﺑﻞ ﺗﻮﺟﻬﯽ وﺟﻮد ﻧﺪارد.
اﻣﮑﺎن ﭘﺬﯾﺮ اﺳﺖ .ﺑﺎ ﻣﻘﺎﯾﺴﻪ اﯾﻦ ﻧﻤﻮدار ﻫﺎ در ﯾﮏ ﭘﺮوژه واﺣﺪ در ﺷﮑﻞ 1و 2 ﮐﺎراﯾﯽ ﻣﺪلﻫﺎﯾﯽ ﮐﻪ از ﻣﺘﺮﯾﮏﻫﺎي ﻃﺮاﺣﯽ اﺳﺘﻔﺎده ﻣﯽﮐﻨﻨﺪ در اﮐﺜﺮ
ﻣﻼﺣﻈﻪ ﻣﯽﺷﻮد ﻣﺪل ﭘﯿﺸﮕﻮﯾﯽ ﺧﻄﺎي ﻧﺮم اﻓﺰار ﻣﺒﺘﻨﯽ ﺑﺮ ﻣﻌﯿﺎر Fﻧﺴﺒﺖ ﺑﻪ ﻣﻮارد ﭘﺎﺋﯿﻦ ﺗﺮﯾﻦ اﺳﺖ.
ﻣﺪل ﻣﺒﺘﻨﯽ ﺑﺮ AUCﮐﺎراﯾﯽ ﺑﻬﺘﺮي را در ﻫﺮ ﺳﻪ ﮔﺮوه از ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ و
-2-1-4ﺗﺴﺖﻫﺎي آﻣﺎري ﻣﺒﺘﻨﯽ ﺑﺮ AUC
ﻃﺮاﺣﯽ و ﺗﺮﮐﯿﺐ آن دو اراﺋﻪ ﮐﺮده اﺳﺖ و اﯾﻦ ﻧﺘﯿﺠﻪ در اﮐﺜﺮ ﻣﻘﺎﯾﺴﻪ ﻧﻤﻮدارﻫﺎ
ﺟﺪول 4ﻧﺘﺎﯾﺞ ﺗﺴﺖ ﻓﺮﯾﺪﻣﻦ و ﺟﺪول 5ﻧﺘﺎﯾﺞ ﺗﺴﺖ وﯾﻠﮑﺎﮐﺴﻮن را روي
ﺑﻪ وﺿﻮح ،ﻣﺸﻬﻮد اﺳﺖ.
ﻣﺠﻤﻮﻋﻪ ﻫﺎي داده NASAﻧﺸﺎن ﻣﯽدﻫﺪ .ﻧﺘﺎﯾﺞ ﺗﺴﺖﻫﺎ ﺑﻪ ﺻﻮرت زﯾﺮ
ﮐﺎرﻫﺎي ﻣﺮﺗﺒﻂ ﭘﯿﺸﯿﻦ -5
ﺑﯿﺎن ﻣﯽﺷﻮد :
اوﻟﯿﻦ ﮐﺎر داده ﮐﺎوي ﺗﻮﺳﻂ ﺳﻠﺒﯽ و ﭘﻮرﺗﺮ ] [5اﻧﺠﺎم ﺷﺪه اﺳﺖ .آﻧﻬﺎ از 16 در 3ﻣﻮرد ﮐﺎراﯾﯽ ﻣﺪلﻫﺎي ﺳﺎﺧﺘﻪ ﺷﺪه از ﮔﺮوه ﻣﺘﺮﯾﮏﻫﺎي ﻫﻤﻪ و ﮐﺪ و
ﭘﺮوژه ﻧﺎﺳﺎ اﺳﺘﻔﺎده ﮐﺮدﻧﺪ و ﯾﮏ روش ﺧﻮدﮐﺎر ﺑﺮاي ﺗﻮﻟﯿﺪ ﻣﺪل ﻫﺎي ﺗﺠﺮﺑﯽ ﻃﺮاﺣﯽ ﺑﺮاﺑﺮﻧﺪ.
ﻣﺒﺘﻨﯽ ﺑﺮ اﺷﯿﺎ ﺑﺮاي ﺷﻨﺎﺳﺎﯾﯽ ﺧﻄﺎﻫﺎي ﻧﺮم اﻓﺰار اراﺋﻪ ﮐﺮدﻧﺪ .ﺑﻌﺪ از آن ﻧﯿﺰ در 11ﻣﻮرد ﮐﺎراﯾﯽ ﻣﺪلﻫﺎي ﺳﺎﺧﺘﻪ ﺷﺪه از ﮔﺮوه ﻣﺘﺮﯾﮏﻫﺎي ﻫﻤﻪ و ﮐﺪ
ﺑﺴﯿﺎري از ﻣﺤﻘﻘﺎن روي ﻣﻮﺿﻮع ﭘﯿﺸﮕﻮﯾﯽ ﺧﻄﺎي ﻧﺮم اﻓﺰار ﮐﺎر ﮐﺮداﻧﺪ و ﺑﺮاﺑﺮﻧﺪ.
ﺑﺮاي ﺑﻪ دﺳﺖ آوردن ﻣﺪلﻫﺎي ﭘﯿﺸﮕﻮﯾﯽ ﺻﺤﯿﺢ ﺗﻼش ﺷﺪه اﺳﺖ .وﻟﯽ ﺗﻨﻬﺎ در 9ﻣﻮرد ﮐﺎراﯾﯽ ﻣﺪلﻫﺎي ﺳﺎﺧﺘﻪ ﺷﺪه از ﮔﺮوه ﻣﺘﺮﯾﮏ ﻃﺮاﺣﯽ ﮐﻢﺗﺮﯾﻦ
اﺳﺖ.
ﺳﻪ ﻣﻄﺎﻟﻌﻪ اﺳﺖ ﮐﻪ ﮐﺎراﯾﯽ ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ و ﻃﺮاﺣﯽ را در ﭘﯿﺸﮕﻮﯾﯽ ﺧﻄﺎي
ﻧﺮم اﻓﺰار ﻣﻘﺎﯾﺴﻪ ﻣﯽﮐﻨﺪ :اوﻟﯿﻦ ﻣﻄﺎﻟﻌﻪ ﺑﻪ وﺳﯿﻠﻪ ژﺋﻮ و ﻫﻤﮑﺎراﻧﺶ در ][6 -2- 4ﻧﺘﺎﯾﺞ ﺗﺠﺮﺑﯽ ﻣﺒﺘﻨﯽ ﺑﺮ ﻣﻌﯿﺎر F
اﺳﺖ .آﻧﻬﺎ ﻣﺘﺮﯾﮏﻫﺎي ﻃﺮاﺣﯽ را از ﮔﺮاف FDLاز ﯾﮏ ﺳﯿﺴﺘﻢ ﺑﻼدرﻧﮓ -1-2-4ﻧﻤﻮدارﻫﺎي ﺟﻌﺒﻪاي ﻣﺒﺘﻨﯽ ﺑﺮ ﻣﻌﯿﺎر F
ﺟﻤﻊ آوري ﮐﺮدﻧﺪ و اﻇﻬﺎر ﮐﺮدﻧﺪ ﮐﻪ ﻣﺪل ﭘﯿﺸﮕﻮﯾﯽ ﮐﻪ از ﻣﺘﺮﯾﮏﻫﺎي ﺷﮑﻞ 2ﻧﻤﻮدارﻫﺎي ﺟﻌﺒﻪاي ﺑﺮاي ﻣﻌﯿﺎر Fاز 12ﻣﺠﻤﻮﻋﻪ داده را ﻧﺸﺎن
ﻃﺮاﺣﯽ اﺳﺘﻔﺎده ﻣﯽﮐﻨﺪ ﺑﻪ ﺧﻮﺑﯽ ﻣﺪﻟﯽ اﺳﺖ ﮐﻪ از ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ اﺳﺘﻔﺎده ﻣﯽدﻫﺪ .از اﯾﻦ ﻧﻤﻮدارﻫﺎي ﺟﻌﺒﻪاي ﻧﺘﺎﯾﺞ زﯾﺮ ﻣﺸﻬﻮد اﺳﺖ:
ﻣﯽﮐﻨﺪ و ﭘﯿﺸﺮﻓﺖ ﻣﻬﻤﯽ وﺟﻮد ﻧﺪارد ﻣﻮﻗﻌﯽ ﮐﻪ ﻣﺘﺮﯾﮏﻫﺎي ﻃﺮاﺣﯽ و ﮐﺪ ﮐﺎراﯾﯽ ﻣﺪلﻫﺎﯾﯽ ﮐﻪ از ﺗﺮﮐﯿﺐ ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ و ﻃﺮاﺣﯽ اﺳﺘﻔﺎده
ﺗﺮﮐﯿﺐ ﻣﯽﺷﻮﻧﺪ و ﺑﺎ ﻫﻢ ﺑﻪ ﻋﻨﻮان ﭘﯿﺸﮕﻮﻫﺎ اﺳﺘﻔﺎده ﻣﯽﺷﻮﻧﺪ .دوﻣﯿﻦ ﻣﻄﺎﻟﻌﻪ ﻣﯽﮐﻨﻨﺪ ﻧﺴﺒﺖ ﺑﻪ ﻣﺪلﻫﺎﯾﯽ ﮐﻪ از ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ اﺳﺘﻔﺎده ﻣﯽﮐﻨﻨﺪ
ﺑﻪ وﺳﯿﻠﻪ ﺟﯿﺎن و ﻫﻤﮑﺎراﻧﺶ ] [7ﺻﻮرت ﮔﺮﻓﺘﻪ اﺳﺖ ﮐﻪ ﻣﺪلﻫﺎي ﭘﯿﺸﮕﻮﯾﯽ ﺗﻘﺮﯾﺒﺎً ﺑﺮاﺑﺮ اﺳﺖ.
ﺳﺎﺧﺘﻪ ﺷﺪه ﺑﺎ اﺳﺘﻔﺎده از ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ و ﻃﺮاﺣﯽ روي ﻣﺠﻤﻮﻋﻪ داده ﮐﺎراﯾﯽ ﻣﺪلﻫﺎﯾﯽ ﮐﻪ از ﻣﺘﺮﯾﮏﻫﺎي ﻃﺮاﺣﯽ اﺳﺘﻔﺎده ﻣﯽﮐﻨﻨﺪ ﻧﺴﺒﺖ ﺑﻪ
NASAرا ﻣﻘﺎﯾﺴﻪ ﮐﺮده اﻧﺪ .آﻧﻬﺎ ﻣﺘﺮﯾﮏﻫﺎي ﻃﺮاﺣﯽ را از ﮔﺮافﻫﺎي ﻣﺪلﻫﺎﯾﯽ ﮐﻪ از ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ ﯾﺎ ﺗﺮﮐﯿﺐ آن دو اﺳﺘﻔﺎده ﻣﯽﮐﻨﻨﺪ در
ﻧﯿﻤﯽ از ﻣﻮارد ﺑﺮاﺑﺮ و در ﺗﻌﺪاد ﻣﺤﺪودي از ﻣﻮارد ﭘﺎﺋﯿﻦ ﺗﺮ ﯾﻦ اﺳﺖ.
FDLو دﯾﺎﮔﺮامﻫﺎي UMLﺟﻤﻊ آوري ﮐﺮده و از آنﻫﺎ ﺑﻪ ﻋﻨﻮان ﭘﯿﺸﮕﻮﻫﺎ
اﺳﺘﻔﺎده ﮐﺮدﻧﺪ و اﻇﻬﺎر ﮐﺮدﻧﺪ از ﺑﯿﻦ ﺳﻪ ﻣﺪل ﭘﯿﺸﮕﻮﯾﯽ ﮐﻪ از ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ -2-2-4ﺗﺴﺖﻫﺎي آﻣﺎري ﻣﺒﺘﻨﯽ ﺑﺮ ﻣﻌﯿﺎر F
ﯾﺎ ﻃﺮاﺣﯽ و ﯾﺎ ﺗﺮﮐﯿﺐ آن دو اﺳﺘﻔﺎده ﻣﯽﮐﻨﻨﺪ ﻣﺪل ﭘﯿﺸﮕﻮﯾﯽ ﮐﻪ از ﺗﺮﮐﯿﺐ ﺟﺪول 6ﻧﺘﺎﯾﺞ ﺗﺴﺖ ﻓﺮﯾﺪﻣﻦ و ﺟﺪول 7ﻧﺘﺎﯾﺞ ﺗﺴﺖ وﯾﻠﮑﺎﮐﺴﻮن را روي
ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ و ﻃﺮاﺣﯽ ﺳﺎﺧﺘﻪ ﻣﯽﺷﻮد ﺑﺎﻻﺗﺮﯾﻦ ﮐﺎراﯾﯽ و ﻣﺪل ﭘﯿﺸﮕﻮﯾﯽ ﻣﺠﻤﻮﻋﻪﻫﺎي داده NASAﻧﺸﺎن ﻣﯽدﻫﺪ .ﻧﺘﺎﯾﺞ اﯾﻦ ﺗﺴﺖﻫﺎ ﺑﻪ ﺻﻮرت زﯾﺮ
ﮐﻪ از ﻣﺘﺮﯾﮏﻫﺎي ﻃﺮاﺣﯽ ﺳﺎﺧﺘﻪ ﻣﯽﺷﻮﻧﺪ ﭘﺎﯾﯿﻦﺗﺮﯾﻦ ﮐﺎراﯾﯽ را دارﻧﺪ .ﺳﻮﻣﯿﻦ ﺑﯿﺎن ﻣﯽﺷﻮد :
ﻣﻄﺎﻟﻌﻪ ﺑﻪ وﺳﯿﻠﻪ ﻧﻮﮔﺮاﻫﻮ و ﻫﻤﮑﺎراﻧﺶ ] [8ﺻﻮرت ﮔﺮﻓﺘﻪ اﺳﺖ آنﻫﺎ در 5ﻣﻮرد ﮐﺎراﯾﯽ ﻣﺪلﻫﺎي ﺳﺎﺧﺘﻪ ﺷﺪه از ﮔﺮوه ﻣﺘﺮﯾﮏﻫﺎي ﻫﻤﻪ و ﮐﺪ و
ﻣﺘﺮﯾﮏﻫﺎ را از دﯾﺎﮔﺮامﻫﺎي ﺗﺮﺗﯿﺒﯽ ﻣﺪل UMLو از ﮐﺪ ﻣﻨﺒﻊ اﺳﺘﺨﺮاج ﻃﺮاﺣﯽ ﺑﺮاﺑﺮﻧﺪ.
ﮐﺮدﻧﺪ و ﺳﻪ ﻣﺪل ﭘﯿﺸﮕﻮﯾﯽ ﺑﺮ اﺳﺎس ﻣﺘﺮﯾﮏﻫﺎي UMLو ﺑﺮ اﺳﺎس در 11ﻣﻮرد ﮐﺎراﯾﯽ ﻣﺪلﻫﺎي ﺳﺎﺧﺘﻪ ﺷﺪه از ﮔﺮوه ﻣﺘﺮﯾﮏﻫﺎي ﻫﻤﻪ و ﮐﺪ
ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ و ﺑﺮ اﺳﺎس ﺗﺮﮐﯿﺐ ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ و UMLﺳﺎﺧﺘﻨﺪ و ﺑﺮاﺑﺮﻧﺪ.
ﺟﺪول :3دﺳﺘﻪ ﺑﻨﺪي ﮐﻨﻨﺪه ﻫﺎ ﻧﺸﺎن دادﻧﺪ ﮐﻪ دو ﻣﺘﺮﯾﮏ ﻃﺮاﺣﯽ UMLﮐﻪ از دﯾﺎﮔﺮامﻫﺎي ﺗﺮﺗﯿﺒﯽ ﺑﻪ دﺳﺖ
آورده ﺑﻮدﻧﺪ 1ﭘﯿﺸﮕﻮﻫﺎي ﻣﻬﻤﯽ از ﮐﻼس ﻫﺴﺘﻨﺪ .ﻫﻤﭽﻨﯿﻦ آنﻫﺎ ﯾﺎﻓﺘﻨﺪ ﮐﻪ
5 4 3 2 1 ردﯾﻒ
دﺳﺘﻪ ﺑﻨﺪي ﻣﺪل ﭘﯿﺸﮕﻮﯾﯽ ﮐﻪ از ﺗﺮﮐﯿﺐ ﻣﺘﺮﯾﮏﻫﺎي ﻃﺮاﺣﯽ UMLو ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ
Naïve Logistic Random
Boosting Bagging
Bayes Regression Forest ﮐﻨﻨﺪه اﺳﺘﻔﺎده ﻣﯽﮐﻨﺪ ﺑﻬﺘﺮﯾﻦ ﮐﺎراﯾﯽ را دارد و اﺳﺘﻔﺎده از ﻣﺘﺮﯾﮏﻫﺎي UMLﺑﻪ
ﻋﻨﻮان ﭘﯿﺸﮕﻮ ﻧﺴﺒﺖ ﺑﻪ ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ ،ﻋﻤﻠﮑﺮد ﺑﻬﺘﺮي دارد.
ﺟﺪول :5ﺗﺴﺖ وﯾﻠﮑﺎﮐﺴﻮن روي ﻣﺠﻤﻮﻋﻪ ﻫﺎي داده NASAﻣﺒﺘﻨﯽ ﺑﺮ AUC ﺑﻪ ﻫﺮ ﺣﺎل ،ﯾﺎﻓﺘﻪﻫﺎي آﻧﺎن ﻫﺮ ﮐﺪام ﺑﺮ اﺳﺎس ﺗﺤﻠﯿﻞﻫﺎﯾﯽ از ﺗﻌﺪادي
ﻣﺠﻤﻮﻋﻪ داده اﺳﺖ .در اﯾﻦ ﻣﻘﺎﻟﻪ از آزﻣﺎﯾﺸﺎت ﻣﺘﻨﻮع ﺗﺮي اﺳﺘﻔﺎده ﺷﺪه اﺳﺖ
ﻣﺠﻤﻮﻋﻪ Pﻓﺮﺿﯿﻪﻫﺎ و ﻣﻘﺪار
ﻧﺘﺎﯾﺞ
ﮐﺪ -ﻫﻤﻪ ﻃﺮاﺣﯽ -ﻫﻤﻪ ﻃﺮاﺣﯽ -ﮐﺪ و آﻣﺎر ﻗﺎﺑﻞ ﺗﻮﺟﻬﯽ ﻣﺸﺎﻫﺪه ﻣﯽ ﺷﻮد.
KC1 1,H0 0/043,H1 0/043,H1 ﻃﺮاﺣﯽ> ﮐﺪ = ﻫﻤﻪ
ﻧﺘﯿﺠﻪ ﮔﯿﺮي -6
KC3 0/225.H0 0/043,H1 0/043.H1 ﻃﺮاﺣﯽ> ﮐﺪ = ﻫﻤﻪ
PC1 1,H0 0/043,H1 0/043,H1 ﻃﺮاﺣﯽ> ﮐﺪ = ﻫﻤﻪ ﻫﺪف اﯾﻦ ﻣﻘﺎﻟﻪ ﺗﺄﺛﯿﺮ ﻣﺘﺮﯾﮏﻫﺎي ﻃﺮاﺣﯽ ﻧﺴﺒﺖ ﺑﻪ ﻣﺘﺮﯾﮏ ﻫﺎي ﮐﺪ در
PC2 0/138,H0 0/043,H1 0/043,H1 ﻃﺮاﺣﯽ> ﮐﺪ = ﻫﻤﻪ
PC3 0/686,H0 0/043,H1 0/042,H1 ﻃﺮاﺣﯽ> ﮐﺪ = ﻫﻤﻪ
ﺑﻬﺒﻮد ﮐﺎراﯾﯽ ﺳﺎﻣﺎﻧﻪﻫﺎي ﺗﺴﺖ اﺗﻮﻣﺎﺗﯿﮏ ﺑﻮده اﺳﺖ و از 11ﻣﺠﻤﻮﻋﻪ دادهي
PC4 0/043,H1 0/043,H1 0/043,H1 ﻃﺮاﺣﯽ> ﮐﺪ> ﻫﻤﻪ در دﺳﺘﺮس ،از اﻧﺒﺎره داده ﭘﺮاﻣﯿﺲ اﺳﺘﻔﺎده ﺷﺪه اﺳﺖ ﮐﻪ ﺑﺎ ﺗﻮﺟﻪ ﺑﻪ
PC5 0/5,H0 0/5,H0 0/416,H0 ﻃﺮاﺣﯽ = ﮐﺪ = ﻫﻤﻪ
ﻧﻤﻮدارﻫﺎي ﺟﻌﺒﻪاي و ﺗﺴﺖﻫﺎي آﻣﺎري ﻧﺘﯿﺠﻪ دﯾﺪه ﻣﯽ ﺷﻮد در ﻋﻤﻠﮑﺮد
MC1 0/279,H0 0/043,H1 0/043,H1 ﻃﺮاﺣﯽ> ﮐﺪ = ﻫﻤﻪ
MC2 0/684,H0 0/043,H1 0/043,H1 ﻃﺮاﺣﯽ> ﮐﺪ = ﻫﻤﻪ ﻣﺪلﻫﺎﯾﯽ ﮐﻪ از ﺗﺮﮐﯿﺐ ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ و ﻃﺮاﺣﯽ اﺳﺘﻔﺎده ﻣﯽﮐﻨﻨﺪ ﻧﺴﺒﺖ ﺑﻪ
MW1 0/144,H0 0/686,H0 0/08,H0 ﻃﺮاﺣﯽ = ﮐﺪ = ﻫﻤﻪ
آنﻫﺎﯾﯽ ﮐﻪ از ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ اﺳﺘﻔﺎده ﻣﯽﮐﻨﻨﺪ ﺑﻬﺒﻮدي ﻗﺎﺑﻞ ﺗﻮﺟﻬﯽ ﻣﺸﺎﻫﺪه
CM1 0/345,H0 0/043,H1 0/043,H1 ﻃﺮاﺣﯽ> ﮐﺪ = ﻫﻤﻪ
KC2 0/176,H0 0/08,H0 0/08,H0 ﻃﺮاﺣﯽ = ﮐﺪ = ﻫﻤﻪ ﻧﻤﯽ ﺷﻮد ﻫﻤﭽﻨﯿﻦ ﻣﺘﺮﯾﮏﻫﺎي ﻃﺮاﺣﯽ ﻧﺴﺒﺖ ﺑﻪ ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ و ﯾﺎ ﺗﺮﮐﯿﺐ
ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ و ﻃﺮاﺣﯽ ﺗﺄﺛﯿﺮ ﮐﻤﺘﺮي ﺑﺮ اﻓﺰاﯾﺶ دﻗﺖ ﺳﺎﻣﺎﻧﻪﻫﺎي ﺗﺴﺖ
اﺗﻮﻣﺎﺗﯿﮏ دارد .ﺿﻤﻨﺎً ﻣﺪل ﭘﯿﺸﮕﻮﯾﯽ ﺧﻄﺎي ﻧﺮم اﻓﺰار ﻣﺒﺘﻨﯽ ﺑﺮ ﻣﻌﯿﺎر Fﻧﺴﺒﺖ
ﺟﺪول :7ﺗﺴﺖ وﯾﻠﮑﺎﮐﺴﻮن روي NASAﻣﺒﺘﻨﯽ ﺑﺮ ﻣﻌﯿﺎر F ﺑﻪ ﻣﺪل ﭘﯿﺸﮕﻮﯾﯽ ﺧﻄﺎي ﻧﺮم اﻓﺰار ﻣﺒﺘﻨﯽ ﺑﺮ AUCﮐﺎراﯾﯽ ﺑﻬﺘﺮي را در ﻫﺮ
ﻣﺠﻤﻮﻋﻪ Pﻓﺮﺿﯿﻪﻫﺎ و ﻣﻘﺪار
ﻧﺘﺎﯾﺞ
ﺳﻪ ﮔﺮوه از ﻣﺘﺮﯾﮏﻫﺎي ﮐﺪ و ﻃﺮاﺣﯽ و ﺗﺮﮐﯿﺐ آن دو اراﺋﻪ ﮐﺮده اﺳﺖ.
ﮐﺪ -ﻫﻤﻪ ﻃﺮاﺣﯽ -ﻫﻤﻪ ﻃﺮاﺣﯽ -ﮐﺪ
KC1 0/416,H0 0/043,H1 0/043,H1 ﻃﺮاﺣﯽ > ﮐﺪ = ﻫﻤﻪ ﺟﺪول : 1ﻣﺠﻤﻮﻋﻪﻫﺎي داده NASA
ﮐﺪ = ﻫﻤﻪ
ﻣﺠﻤﻮﻋﻪ %داﺷﺘﻦ ﺧﻄﺎ ﻣﺘﺮﯾﮏﻫﺎ
KC3 0/223,H0 0/08,H0 0/043,H1 ﻫﻤﻪ = ﻃﺮاﺣﯽ ﻣﺜﺎلﻫﺎ
داده ﻫﻤﻪ ﻃﺮاﺣﯽ ﮐﺪ
ﻃﺮاﺣﯽ> ﮐﺪ
CM1 % 9/83 505 22 5 17
PC1 0/273,H0 0/043,H1 0/043,H1 ﻃﺮاﺣﯽ > ﮐﺪ = ﻫﻤﻪ
PC2 0/317,H0 0/655,H0 0/317,H0 ﻃﺮاﺣﯽ = ﮐﺪ = ﻫﻤﻪ KC1 % 15/46 2407 22 5 17
PC3 0/066,H0 0/5,H0 0/5,H0 ﻃﺮاﺣﯽ = ﮐﺪ = ﻫﻤﻪ KC3 % 9/39 458 40 16 20
PC4 0/043,H1 0/043,H1 0/042,H1 ﻃﺮاﺣﯽ>ﮐﺪ>ﻫﻤﻪ % 6/94
PC1 1107 22 5 17
ﻃﺮاﺣﯽ = ﮐﺪ
PC3 %10/23 1563 38 16 20
PC5 0/131,H0 0/042,H1 0/077,H0 ﻃﺮاﺣﯽ > ﻫﻤﻪ
ﮐﺪ = ﻫﻤﻪ PC4 % 12/2 1458 38 16 20
MC1 0/414,H0 0/715,H0 0/461,H0 ﻃﺮاﺣﯽ = ﮐﺪ = ﻫﻤﻪ % 7/69
MW1 433 38 16 20
MC2 0/686,H0 0/686,H0 0/892,H0 ﻃﺮاﺣﯽ = ﮐﺪ = ﻫﻤﻪ
MC2 % 32/3 161 40 16 20
ﮐﺪ = ﻫﻤﻪ
MW1 0/066,H0 0/138,H0 0/042,H2 ﻫﻤﻪ = ﻃﺮاﺣﯽ MC1 % 0/72 9466 39 15 20
ﻃﺮاﺣﯽ < ﮐﺪ % 0/41
PC2 5589 37 16 19
CM1 0/109,H0 0/225,H0 0/336,H0 ﻃﺮاﺣﯽ = ﮐﺪ = ﻫﻤﻪ
PC5 %3 17186 39 15 20
ﻃﺮاﺣﯽ = ﮐﺪ
KC2 0/581,H0 0/042,H1 0/684,H0 ﻃﺮاﺣﯽ > ﻫﻤﻪ KC2 % 20/5 522 22 5 17
ﮐﺪ = ﻫﻤﻪ
1
Message detailedness and import coupling
ﻣﺘﺮﯾﮏﻫﺎي اﺳﺘﻔﺎده ﺷﺪه در اﯾﻦ ﻣﻘﺎﻟﻪ:2 ﺟﺪول
ﮔﺮوه دﯾﮕﺮ
ﮐﺪ ﻃﺮاﺣﯽ
دﯾﮕﺮ
PARAMETER_COUNT EDGE_COUNT:e NORMALIZED_ CYCLOMATIC_COMPLEXITY
FORMAL PARAMETER NODE_COUNT:n GLOBAL_DATA_COMPLEXY:gdv(G)
NUM_OPERATORS:N1 BRANCH_COUNT GLOBAL_DATA_DENSITY
NUM_OPERANDS:N2 CALL_PAIRS CYCLOMATIC_DENSITY
CONDITION_COUNT
NUM_UNIQUE_OPERATORS: CYCLOMATIC_COMPLEXITY:v(G)
DECISION_COUNT
NUM_UNIQUE_OPERATORS:
DECISION_DENSITY
HALSTEAD_CONTENT: DESIGN_ COMPLEXITY:iv(G)
HALSTEAD_LENGTH:N DESIGN_DENSITY
HALSTEAD_LEVEL:L ESSENTIAL_ COMPLEXITY:ev(G)
ﻣﺘﺮﯾﮏﻫﺎ ESSENTIAL_DENSITY
HALSTEAD_DIFFICULTY:D
HALSTEAD_VOLUME:V MAINTENANCE_SEVERITY
HALSTEAD_EFFORT:E MODIFIED_CONDITION_COUNT
HALSTEAD_PROG_TIME:T MULTIPLE_ CONDITION_COUNT
HALSTEAD_ERROR_EST:B PATHOLOGICAL_ COMPLEXITY
NUMBER_OF_LINES
LOC_BLANK
LOC_CODE_AND_COMMENT:NCSLOC
LOC_COMMENTS
LOC_EXECUTABLE
PERCENT_COMMENTS
LOC_TOTAL
AUC ﻣﺒﺘﻨﯽ ﺑﺮNASA ﻧﺘﺎﯾﺞ ﺗﺴﺖ ﻓﺮﯾﺪﻣﻦ روي ﻣﺠﻤﻮﻋﻪ دادهﻫﺎي: 4 ﺟﺪول
KC2 CM1 MW1 MC2 MC1 PC5 PC4 PC3 PC2 PC1 KC3 KC1 ﻣﺠﻤﻮﻋﻪ
٠/١٦٥ ٠/٠١٥ ٠/٣٣١ ٠/٠٢٢ ٠/٠١٥ ٠/٢٤٧ ٠/٠٠٧ ٠/٠٢٢ ٠/٠١٥ ٠/٠١٥ ٠/٠١٥ ٠/٠٢٢ P ﻓﺮﻳﺪﻣﻦ
KC2 CM1 MW1 MC2 MC1 PC5 PC4 PC3 PC2 PC1 KC3 KC1 ﻣﺠﻤﻮﻋﻪ
٠/١٩٦ ٠/١٣٥ ٠/٠٢١ ٠/٨١٩ ٠/٥٤٩ ٠/٠٤١ ٠/٠٠٧ ٠/١٠٤ ٠/٦٠٧ ٠/٠١٦ ٠/٠٧٤ ٠/٠٢٢ P ﻓﺮﻳﺪﻣﻦ
ﻣﺠﻤﻮﻋﻪ داده12 ازF ﻧﻤﻮدارﻫﺎي ﺟﻌﺒﻪاي ﻣﺒﺘﻨﯽ ﺑﺮ ﻣﻌﯿﺎر:2 ﺷﮑﻞ
ﻣﻨﺎﺑﻊ
[9] M. Chapman, P. Callis, W. Jackson, Metrics Data Program, [1] N. Ohlsson, M. Helander, C. Wohlin, "Quality improvement
NASA IV and V Facility, http://mdp.ivv.nasa.gov/, 2004. by identification of fault-prone modul using software design
[10] Metric data program. NASA Independent Verification and metrics", Proc, 6th International Conference on Software
Validation facility, Available from http://MDP.ivv.nasa.gov. Quality, pp. 1–13, Ottawa, Canada, 1996.
[11] U. of Waikato. Weka software package. The University of [2] W. Gibbs, Software’s chronic crisis, Scientific American, 86–
Waikato, available http://www.cs.waikato.ac.nz/ml/weka/. 94, September (1994).
[12] J. Demsar, "Statistical comparisons of classifiers over multiple [3] I, Sommerville, Software Engineering, Addison-Wesley,
data sets", Journal of Machine Learning Research, 7, 2006. Reading, MA, 1996.
[13] SPSS Statistics 19.0.0 [4] F. Shull, V. B. ad B, Boehm, A. Brown, P. Costa, M. Lindvall,
D. Port, I. Rus, R. Tesoriero, M. Zelkowitz, "What we have
learned about fighting defects", in Proceedings of 8th
1
8 to 20 LOC/minute International Software Metrics Symposium, pp. 249–258,
2
boxplot Ottawa, Canada, 2002. available from
3
Area under the curve http://fcmd.umd.edu/fcmd/Papers/shull defects.ps.
4
F-measure [5] R.W. SELBY, A.A. PORTER, "SOFTWARE METRIC CLASSIFICATION
5
DEFECT TREES HELP GUIDE THE MAINTENANCE OF LARGE-SCALE SYSTEM",
6
Machin learning SOFTWARE MAINTENANCE, 1989., PROCEEDINGS., CONFERENCE
7
Receiver operating characteristic ON, PP. 116–123, MIAMI, FL, USA, 1989.
8
Friedman [6] M. Zhao, C. Wohlin, N. Ohlsson, and M. Xie. "A comparison
9 between software design and code metrics for the prediction of
Wilcoxon
10
P-value software fault content" Information and Software Technology,
40(14) :801–809, 1998.
[7] Y. Jiang, B. Cuki, T. Menzies, and N. Bartlow. "Comparing
design and code metrics for software quality prediction", In
Proceedings of the 4th international workshop on Predictor
models in software engineering, pages 11–18. ACM
NewYork, NY, USA, 2008.
[8] A. Nugroho, M.r.v. Chaudron, E. Arisholm, "Assessing UML
Design Metrics for Predicting Fault-prone Classes in a Java
System", IEEE, PP. 21-30, 2010.