Professional Documents
Culture Documents
1027 صابرکاری
1027 صابرکاری
-2ﻣﻘﺪﻣﻪ
ژﻧﺘﯿﮏ زﻣﺎﻧﯽ ﺑﻪﻋﻨﻮان ﯾﮏ ﻋﻠﻢ ﻧﻤﻮد ﭘﯿﺪا ﮐﺮد ﮐﻪ ﺑﺸﺮ درﯾﺎﻓﺖ ﻫﯿﭻ
ﻣﻮﺟﻮدي ﯾﮏ ﮐﭙﯽ از ﺧﻮد را ﺑﻪ ﻧﺴﻞ ﺑﻌﺪ ﻣﻨﺘﻘﻞ ﻧﻤﯽﻧﻤﺎﯾﺪ ،ﺑﻠﮑﻪ ﻣﺠﻤﻮﻋﻪاي
از اﻃﻼﻋﺎت را ﺑﻪﻧﺴﻞ ﺑﻌﺪ ﻣﻨﺘﻘﻞ ﻣﯽﮐﻨﺪ ﮐﻪ وﯾﮋﮔﯽﻫﺎي ﻣﺘﻔﺎوﺗﯽ را در ﻧﺴﻞ
ﺑﻌﺪ از ﺧﻮد اﯾﺠﺎد ﻣﯽﮐﻨﺪ .داﮐﺴﯽ رﯾﺒﻮﻧﻮﮐﻠﺌﯿﮏ اﺳﯿﺪ ) (DNAاز ﮐﻠﯿﺪيﺗﺮﯾﻦ
و اﺻﻠﯽﺗﺮﯾﻦ ﺗﺮﮐﯿﺒﺎت ﺷﯿﻤﯿﺎﺋﯽ در ﺳﻠﻮلﻫﺎي ﺟﺎﻧﺪاران ،ﺑﺎﮐﺘﺮيﻫﺎ و ﺑﺮﺧﯽ
ﺷﮑﻞ :1ﺳﺎﺧﺘﺎر ﻣﻮﻟﮑﻮل DNA
وﯾﺮوسﻫﺎ ﻣﯽﺑﺎﺷﺪ .ﯾﮏ رﺷﺘﻪ DNAﻣﻠﮑﻮل ﻃﻮﯾﻠﯽ از ﺧﺎﻧﻮاده
ﺑﯿﻮﭘﻠﯿﻤﺮﻫﺎﺳﺖ ﮐﻪ اﻃﻼﻋﺎت ژﻧﺘﯿﮑﯽ را ﺣﻤﻞ ﻣﯽﮐﻨﺪ و داراي وﻇﺎﯾﻒ
در ﯾﻮﮐﺎرﯾﻮتﻫﺎ DNAﺑﻪ دو ﻧﺎﺣﯿﻪ ژﻧﯽ و ﺑﯿﻦ ژﻧﯽ ﺗﻘﺴﯿﻢ ﻣﯽﺷﻮد .ﺗﻨﻬﺎ
ﻧﺎﺣﯿﻪ ژﻧﯽ ﯾﺎ ﺑﻪ اﺧﺘﺼﺎر ژن اﻃﻼﻋﺎت را ﺑﺮاي ﺳﻨﺘﺰ ﭘﺮوﺗﺌﯿﻦﻫﺎ ﺣﻤﻞ ﻣﯽﮐﻨﺪ.
ﻫﺮ ژن ﻧﯿﺰ ﺑﻪ ﻧﻮﺑﻪ ﺧﻮد ﻣﺘﺸﮑﻞ از ﻧﻮاﺣﯽ اﮐﺴﻮن 1و اﻧﺘﺮون 2ﻣﯽﺑﺎﺷﺪ ﮐﻪ در
ﺣﻤﯿﺪرﺿﺎ ﺻﺎﺑﺮﮐﺎري ،داﻧﺸﮕﺎه ﺻﻨﻌﺘﯽ ﺳﻬﻨﺪ ،داﻧﺸﮑﺪه ﺑﺮق ،ﺗﺒﺮﯾﺰ ) email:
ﺷﮑﻞ 2ﻧﺸﺎن داده ﺷﺪه اﺳﺖ .ﺑﻨﺎﺑﺮاﯾﻦ اﮐﺴﻮنﻫﺎ ﮐﺪﻫﺎي ﻻزم را ﺑﺮاي ﺗﻮﻟﯿﺪ (h_saberkari@sut.ac.ir
ﻣﻮﺳﯽ ﺷﻤﺴﯽ ،داﻧﺸﮕﺎه ﺻﻨﻌﺘﯽ ﺳﻬﻨﺪ ،داﻧﺸﮑﺪه ﺑﺮق ،ﺗﺒﺮﯾﺰ ) email:
(shamsi@sut.ac.ir
1
Exon ﻣﺤﻤﺪﺣﺴﯿﻦ ﺻﺪاﻗﯽ ،داﻧﺸﮕﺎه ﺻﻨﻌﺘﯽ ﺳﻬﻨﺪ ،داﻧﺸﮑﺪه ﺑﺮق ،ﺗﺒﺮﯾﺰ ) email:
2
Intron (sedaaghi@sut.ac.ir
2
-4اﺳﺘﻔﺎده از DFTدر ﺗﻌﯿﯿﻦ ﻣﻮﻟﻔﻪﻫﺎي ﺗﻨﺎوب3- ﭘﺮوﺗﺌﯿﻦ ﺣﻤﻞ ﻣﯽﮐﻨﻨﺪ ،از اﯾﻦرو ﺑﻪ آنﻫﺎ ﻧﻮاﺣﯽ ﮐﺪﮐﻨﻨﺪه ﭘﺮوﺗﺌﯿﻦ ﻣﯽﮔﻮﯾﻨﺪ.
ﺗﻨﻬﺎ ﺣﺪود 2اﻟﯽ 5درﺻﺪ از ﮐﻞ DNAاﻧﺴﺎن را ﻧﻮاﺣﯽ ژﻧﯽ ﺗﺸﮑﯿﻞ ﻣﯽدﻫﺪ.
از DFTﺑﺮاي ﺗﺤﻠﯿﻞ ﻃﯿﻔﯽ ﺗﻮاﻟﯽ ﻋﺪدي DNAﺑﺎ ﻃﻮل ﻣﺤﺪود اﺳﺘﻔﺎده
ﻣﯽﺷﻮد .ﻃﺒﻖ ﺗﻌﺮﯾﻒ ﺑﺮاي ﯾﮏ ﺑﻠﻮك ) x(nﺑﻪ ﻃﻮل DFT ،Nﻋﺒـﺎرت اﺳـﺖ
از]:[6
N 1
j2 kn
X[k ] x (n ) w (n ) e N ,0 k N 1 )(1
n 0
ﮐﻪ ) w(nﭘﻨﺠﺮهاي ﺑﻪ ﻃﻮل Nاﺳﺖ .ﺑﺎ ﻣﺤﺎﺳﺒﻪ DFTﺑﺮاي دﻧﺒﺎﻟﻪ ]X[k ﺷﮑﻞ : 2ﻧﻮاﺣﯽ اﮐﺴﻮن -اﻧﺘﺮون در DNAﯾﻮﮐﺎرﯾﻮﺗﯽ
ﻃﯿﻒ ﺗﻮاﻟﯽ DNAﻋﺒﺎرت اﺳﺖ از:
] S [k ] X [k
2 )(2 ﯾﮑﯽ از ﻣﺤﺮكﻫﺎي اﺳﺎﺳﯽ در اﺳﺘﻔﺎده از اﺑﺰارﻫﺎي ﭘﺮدازش ﺳﯿﮕﻨﺎل در
ﺑﻪﻣﻨﻈﻮر ﺗﻌﯿﯿﻦ ﻣﻮﻟﻔﻪ ﺗﻨﺎوب) 3-در ﻓﺮﮐﺎﻧﺲ = ،(fﻣﯽﺗﻮان ﻣﻘﺪار ﻃﯿﻒ ژﻧﻮﻣﯿﮏ ،ﯾﺎﻓﺘﻦ ﺗﻨﺎوبﻫﺎي ﭘﻨﻬﺎن و ﯾﺎ اﻟﮕﻮﻫﺎي ﻧﻮﺳﺎنﮐﻨﻨﺪه در ﺗﻮاﻟﯽﻫﺎي
] S[kرا در ﻧﻘﻄﻪ = Kﺑﺎ ﻓﺮض اﯾﻨﮑﻪ ﻃﻮل Nﻣﻀﺮﺑﯽ ازﺳﻪ اﺳﺖ ،ﻣﺤﺎﺳﺒﻪ ژﻧﯽ اﺳﺖ ﮐﻪ ﺗﻮﺳﻂ Trifonoveدر ] [3ﺑﻪﻋﻨﻮان ﺗﻨﺎوبﻫﺎي 200 ،10/5 ،3
ﮐﺮد .اﮔﺮ ﺗﻮاﻟﯽ DNAﻣﺘﻌﻠﻖ ﺑﻪ ﯾﮏ ﻧﺎﺣﯿﻪ ﭘﺮوﺗﺌﯿﻨﯽ ﺑﺎﺷﺪ ] S[Kدر داراي و 400ﺑﺎز ﺗﻮﺻﯿﻒ ﺷﺪه اﺳﺖ .در ﻣﯿﺎن آنﻫﺎ ﺧﺎﺻﯿﺖ ﺗﻨﺎوب 3-ﺑﻪﻋﻨﻮان ﯾﮏ
ﻣﻘﺪار ﭘﯿﮏ ﺑﻮده در ﺣﺎﻟﯿﮑﻪ اﯾﻦ ﭘﯿﮏ در ﻧﻮاﺣﯽ ﻏﯿﺮﭘﺮوﺗﺌﯿﻨﯽ ﻣﺸﺎﻫﺪه ﻧﻤﯽ- ﻣﺸﺨﺼﻪ اﺻﻠﯽ ﻧﻮاﺣﯽ ﮐﺪﮐﻨﻨﺪه ﭘﺮوﺗﺌﯿﻦ در ﺗﻮاﻟﯽﻫﺎي ﯾﻮﮐﺎرﯾﻮت و ﭘﺮﯾﮑﺎرﯾﻮت
ﺷﻮد .ﻧﮑﺘﻪ ﻣﻬﻢ ﺗﻌﯿﯿﻦ ﻃﻮل ﭘﻨﺠﺮه ) (Nاﺳﺖ .ﻣﻘﺪار Nرا ﺑﺎﯾﺪ ﺑﺰرگ در ﻧﻈﺮ ﺷﻨﺎﺧﺘﻪ ﻣﯽﺷﻮد .اﯾﻦ ﺧﺎﺻﯿﺖ ﻣﯽﺗﻮاﻧﺪ ﺑﻪﻋﻠﺖ اﺳﺘﻔﺎده ﻏﯿﺮﻫﻤﮕﻦ از ﮐﺪونﻫﺎ
ﮔﺮﻓﺖ ﮐﻪ در اﯾﻨﺼﻮرت ﭘﯿﮏﻫﺎي اﯾﺠﺎد ﺷﺪه ﻧﺎﺷﯽ از ﺧﺎﺻﯿﺖ ﺗﻨﺎوﺑﯽ ﺑﺮ ﻧﻮﯾﺰ ﺑﺎﺷﺪ .اﯾﻦ ﺑﺪﯾﻦ ﻣﻌﻨﯽ اﺳﺖ ﮐﻪ ﺑﺎ وﺟﻮد اﯾﻨﮑﻪ ﭼﻨﺪ ﮐﺪون ﻣﻤﮑﻦ اﺳﺖ ﯾﮏ
ﭘﺲزﻣﯿﻨﻪ ﻏﻠﺒﻪ ﻣﯽﮐﻨﺪ .از ﻃﺮﻓﯽ ﻃﻮل ﭘﻨﺠﺮه را ﻧﺒﺎﯾﺪ زﯾﺎد ﺑﺰرگ در ﻧﻈﺮ اﺳﯿﺪ آﻣﯿﻨﻪ ﺧﺎص را رﻣﺰدﻫﯽ ﮐﻨﻨﺪ ،ﻫﻤﻪ آنﻫﺎ ﺑﺎ اﺣﺘﻤﺎل ﯾﮑﺴﺎﻧﯽ در ﻣﻮﺟﻮدات
ﮔﺮﻓﺖ زﯾﺮا اﯾﻦ ﮐﺎر ﺑﺎﻋﺚ اﻓﺰاﯾﺶ ﻣﺤﺎﺳﺒﺎت و در ﻧﺘﯿﺠﻪ ﮐﺎﻫﺶ رزوﻟﻮﺷﻦ زﻧﺪه ﻇﺎﻫﺮ ﻧﻤﯽﺷﻮﻧﺪ .ﻣﺜﻼ ﻧﻮﮐﻠﺌﻮﺗﯿﺪ Gدر ﻣﻮﻗﻌﯿﺖﻫﺎي ﺧﺎﺻﯽ در ﮐﺪونﻫﺎي
ﺑﺮاي ﺗﻌﯿﯿﻦ ﻣﻮﻗﻌﯿﺖﻫﺎي اﺑﺘﺪاﯾﯽ و اﻧﺘﻬﺎﯾﯽ اﮐﺴﻮن ﺧﻮاﻫﺪ ﺷﺪ .ﻣﻘﺪار ﭘﯿﺸﻨﻬﺎد ﻧﻮاﺣﯽ اﮐﺴﻮن ﺟﺎ ﻣﯽﮔﯿﺮد].[4
ﺷﺪه ﺑﺮاي Nدر ﻣﻘﺎﻻت ﺑﺮاﺑﺮ 351اﺳﺖ ﮐﻪ ﻣﺎ ﻧﯿﺰ در اﯾﻦ ﻣﻘﺎﻟﻪ از اﯾﻦ ﻣﻘﺪار در اﯾﻦ ﻣﻘﺎﻟﻪ اﻟﮕﻮرﯾﺘﻤﯽ ﺑﺮ ﻣﺒﻨﺎي ﺗﺮﮐﯿﺐ DFTو ﺗﺒﺪﯾﻞ ﻣﻮﺟﮏ ﭘﯿﻮﺳﺘﻪ
اﺳﺘﻔﺎده ﮐﺮدهاﯾﻢ].[7 ﺑﻪﻣﻨﻈﻮر ﺷﻨﺎﺳﺎﯾﯽ ﻧﻮاﺣﯽ ﮐﺪﮐﻨﻨﺪه ﭘﺮوﺗﺌﯿﻦ در ﺗﻮاﻟﯽ DNAاراﺋﻪ ﻣﯽﮐﻨﯿﻢ.
ﻫﻤﭽﻨﯿﻦ اﺛﺮ ﭘﻨﺠﺮهﻫﺎي ﻣﺨﺘﻠﻒ در ﺣﺬف ﻧﻮﯾﺰ ﭘﺲزﻣﯿﻨﻪ ﺑﺮرﺳﯽ ﻣﯽﺷﻮد.
-5اﻟﮕﻮرﯾﺘﻢ ﭘﯿﺸﻨﻬﺎدي ﭘﯿﮑﺮﺑﻨﺪي ﻣﻘﺎﻟﻪ ﺑﻪﺻﻮرت زﯾﺮ اﺳﺖ :در ﺑﺨﺶ 3ﻧﮕﺎﺷﺖ EIIPﺑﻪﻋﻨﻮان روش
در اﯾﻦ ﺑﺨﺶ اﻟﮕﻮرﯾﺘﻤﯽ ﺑﻬﯿﻨﻪ ﺟﻬﺖ ﺗﻌﯿﯿﻦ ﻣﮑﺎن ﻧﻮاﺣﯽ ﭘﺮوﺗﺌﯿﻦ ﺑﺮ ﺑﻪﮐﺎر رﻓﺘﻪ در اﯾﻦ ﻣﻘﺎﻟﻪ ﺑﻪﻣﻨﻈﻮر ﺗﺒﺪﯾﻞ ﺗﻮاﻟﯽﻫﺎي DNAﺑﻪ ﺳﯿﮕﻨﺎلﻫﺎي
ﻣﺒﻨﺎي ﺗﺮﮐﯿﺐ DFTو ﺗﺒﺪﯾﻞ ﻣﻮﺟﮏ ﭘﯿﻮﺳﺘﻪ اراﺋﻪ ﻣﯽﺷﻮد .ﺟﺰﺋﯿﺎت ﻣﺮﺑﻮط ﺑﻪ ﻋﺪدي ﻣﻌﺮﻓﯽ ﻣﯽﺷﻮد .در ﺑﺨﺶ 4از ﺗﺒﺪﯾﻞ DFTﺑﻪﻣﻨﻈﻮر ﺗﻌﯿﯿﻦ ﻣﻮﻟﻔﻪﻫﺎي
اﯾﻦ اﻟﮕﻮرﯾﺘﻢ در ﺷﮑﻞ 3ﻧﺸﺎن داده اﺳﺖ. ﺗﻨﺎوب 3-در ﺗﻮاﻟﯽ DNAاﺳﺘﻔﺎده ﻣﯽﮐﻨﯿﻢ .در ﺑﺨﺶ 5اﻟﮕﻮرﯾﺘﻢ ﭘﯿﺸﻨﻬﺎدي
ﺑﻪﻣﻨﻈﻮر ﺣﺬف ﻧﻮﯾﺰ ﻓﺮﮐﺎﻧﺲ ﺑﺎﻻ در ﻃﯿﻒ ﻓﻮرﯾﻪ ﺗﻮاﻟﯽ DNAو در ﻧﺘﯿﺠﻪ ﺑﺮ ﻣﺒﻨﺎي ﺗﺮﮐﯿﺐ DFTو ﺗﺒﺪﯾﻞ ﻣﻮﺟﮏ ﻣﻌﺮﻓﯽ و ﺑﻪ ﻣﻨﻈﻮر ﺑﻬﺒﻮد ﮐﯿﻔﯿﺖ
ﺑﻬﺒﻮد ﮐﯿﻔﯿﺖ ﺗﺨﻤﯿﻦ ﻧﻮاﺣﯽ ژﻧﯽ از ﺗﺒﺪﯾﻞ ﻣﻮﺟﮏ ﭘﯿﻮﺳﺖ اﺳﺘﻔﺎده ﮐﺮده و ﺗﺨﻤﯿﻦ اﺛﺮ ﭘﻨﺠﺮهﻫﺎي ﻣﺨﺘﻠﻒ در ﺗﻌﯿﯿﻦ ﻧﻮاﺣﯽ ﮐﺪﮐﻨﻨﺪه ﭘﺮوﺗﺌﯿﻦ ﺑﺮرﺳﯽ ﻣﯽ-
آنرا ﺑﺮروي ] S[kاﻋﻤﺎل ﻣﯽﮐﻨﯿﻢ .اﯾﻦ ﺗﺒﺪﯾﻞ ﺑﻪﺻﻮرت ﺟﻤﻊ ﺑﺮروي ﻫﻤﻪ ﺷﻮد .ﻧﺘﺎﯾﺞ ﺷﺒﯿﻪﺳﺎزي ﺑﺮ روي ﭼﻨﺪ ژن در ﭘﺎﯾﮕﺎه Genebankدر ﺑﺨﺶ6
زﻣﺎن ﺳﯿﮕﻨﺎل ﺗﻌﺮﯾﻒ ﻣﯽﺷﻮد ﮐﻪ در ﻧﺴﺨﻪﻫﺎي ﺗﻮزﯾﻦ ﺷﺪه 1و اﻧﺘﻘﺎل ﯾﺎﻓﺘﻪ از ﻣﻮرد ﺑﺮرﺳﯽ ﻗﺮار ﮔﺮﻓﺘﻪ و ﻧﻬﺎﯾﺘﺎ ﺑﺨﺶ 7ﺷﺎﻣﻞ ﺟﻤﻊﺑﻨﺪي از ﻣﻘﺎﻟﻪ و ﻧﺘﯿﺠﻪ-
ﺗﺎﺑﻊ وﯾﻮﻟﺖ ﺿﺮب ﺷﺪه اﺳﺖ .ﺿﺮاﯾﺐ اﯾﻦ ﺗﺒﺪﯾﻞ ﺑﻪﺻﻮرت زﯾﺮ ﺗﻌﺮﯾﻒ ﻣﯽ- ﮔﯿﺮي اﺳﺖ.
ﺷﻮد]:[8
1 )(3 -3ﺗﺒﺪﯾﻞ ﺗﻮاﻟﯽﻫﺎي DNAﺑﻪ ﺳﯿﮕﻨﺎلﻫﺎي دﯾﺠﯿﺘﺎل
xb
W(a , b)
f ( S[ k] )dx
a a R
در اﯾﻦ ﻣﻘﺎﻟﻪ از ﻧﮕﺎﺷﺖ EIIPﺑﺮاي ﺗﺒﺪﯾﻞ ﺗﻮاﻟﯽ ﻧﻮﮐﻠﺌﻮﺗﯿﺪﻫﺎ ﺑﻪ ﺳﯿﮕﻨﺎل
ﮐﻪ در آن Ψﺗﺎﺑﻊ ﮐﺎوش 2ﺑﻮده و در اﯾﻦ ﻣﻘﺎﻟﻪ از ﺗﺎﺑﻊ Symletاﺳﺘﻔﺎده ﺷﺪه ﻋﺪدي اﺳﺘﻔﺎده ﺷﺪه اﺳﺖ .اﯾﻦ روش ﺑﺮ اﺳﺎس ﻧﯿﺮوي ﻣﺘﻘﺎﺑﻞ اﻟﮑﺘﺮون -ﯾﻮن
اﺳﺖ a ،ﺑﻪ ﻋﻨﻮان ﯾﮏ ﻣﻘﯿﺎس زﻣﺎﻧﯽ ﻣﻄﺮح اﺳﺖ و bﺑﺮاي اﻧﺘﻘﺎل ) x(tدر در ﻫﺮ ﻧﻮﮐﻠﺌﻮﺗﯿﺪ ﺗﻌﺮﯾﻒ ﻣﯽﺷﻮد .ﻣﻘﺎدﯾﺮ EIIPﺑﺮاي ﻫﺮ ﻧﻮﮐﻠﺌﻮﺗﯿﺪ ﻋﺒﺎرت
ﻃﻮل زﻣﺎن tاﺳﺘﻔﺎده ﻣﯽﺷﻮد .ﻫﻤﭽﻨﯿﻦ ﻋﺎﻣﻞ ﻧﺮﻣﺎﻟﯿﺰاﺳﯿﻮن √ ﺗﻀﻤﯿﻦ ﻣﯽ- اﺳﺖ از T =0/1335 ،G =0/0806 ،A=0/1260 :و .[5] C =0/1340
ﮐﻨﺪ ﮐﻪ اﻧﺮژي ﺑﺮاي ﺗﻤﺎم ﻣﻘﺎدﯾﺮ aﯾﮑﺴﺎن ﺧﻮاﻫﺪ ﺑﻮد.
1
Scaled version
2
Probing Function
3
در اﯾﻦ ﻣﻘﺎﻟﻪ ﺑﺎ اﺳﺘﻔﺎده از اﻟﮕﻮرﯾﺘﻢ ﺗﺮﮐﯿﺒﯽ DFTو ﺗﺒﺪﯾﻞ ﻣﻮﺟﮏ ﭘﯿﻮﺳﺘﻪ ﺷﮑﻞ 4ﭘﺎﺳﺦ ﻓﺮﮐﺎﻧﺴﯽ ﭘﻨﺠﺮهﻫﺎي ﻣﺨﺘﻠﻒ FIRرا ﻧﺸﺎن ﻣﯽدﻫﺪ.
ﺑﻪ ﺗﻌﯿﯿﻦ ﻣﮑﺎن ﭘﺮوﺗﺌﯿﻦﻫﺎ در ﺗﻮاﻟﯽ DNAﭘﺮداﺧﺘﯿﻢ .ﺑﻪﻣﻨﻈﻮر از ﺑﯿﻦ ﺑﺮدن ﻫﻤﺎﻧﻄﻮر ﮐﻪ ﻣﺸﺎﻫﺪه ﻣﯽﮐﻨﯿﻢ ﭘﻨﺠﺮه ﻣﺴﺘﻄﯿﻠﯽ داراي ﺑﺎرﯾﮏﺗﺮﯾﻦ ﻟﻮب اﺻﻠﯽ
ﮐﺎﻣﻞ ﻧﻮﯾﺰ ﭘﺲزﻣﯿﻨﻪ از ﭘﻨﺠﺮه Blackmanﺑﺠﺎي ﭘﻨﺠﺮه ﻣﺴﺘﻄﯿﻠﯽ اﺳﺘﻔﺎده و در ﻧﺘﯿﺠﻪ ﮐﻤﺘﺮﯾﻦ ﻣﯿﺰان ﺗﻀﻌﯿﻒ و ﭘﻨﺠﺮه Blackmanداراي ﺑﯿﺸﺘﺮﯾﻦ
ﻧﻤﻮدﯾﻢ .اﯾﻦ ﭘﻨﺠﺮه ﺑﻪ دﻟﯿﻞ اﺧﺘﺼﺎص دادن وزن زﯾﺎد ﺑﻪ ﮐﺪونﻫﺎي ﻣﻮﺟﻮد در ﻣﯿﺰان ﺗﻀﻌﯿﻒ ﻟﻮب اﺻﻠﯽ اﺳﺖ .ﻫﺮﭼﻪ اﯾﻦ ﻣﯿﺰان ﺗﻀﻌﯿﻒ ﺑﯿﺸﺘﺮ ﺑﺎﺷﺪ ﺣﺬف
ﻣﺮﮐﺰ ﭘﻨﺠﺮه ﻧﺴﺒﺖ ﺑﻪ ﭘﻨﺠﺮه ﻣﺴﺘﻄﯿﻠﯽ ﻧﺘﯿﺠﻪ ﺑﻬﺘﺮي ﺑﻪدﺳﺖ ﻣﯽدﻫﺪ .ﻃﻮل ﻧﻮﯾﺰ ﭘﺲزﻣﯿﻨﻪ ﺑﻬﺘﺮ اﻧﺠﺎم ﻣﯽﮔﯿﺮد.
4
All positions
0.35 0.35
1st positions 2nd postitions
0.35 0.35
3rd positions اﻧﺘﺨﺎب اﯾﻦ ﻃﻮل. در ﻧﻈﺮ ﮔﺮﻓﺘﻪ ﺷﺪه ﺑﻮد351 ﭘﻨﺠﺮه ﺑﮑﺎررﻓﺘﻪ در اﯾﻦ ﻣﻘﺎﻟﻪ
0.3 0.3 0.3 0.3
- ﺗﺮﮐﯿﺐ ﺗﮑﻨﯿﮏ.ﻧﻤﯽﺗﻮاﻧﺪ ﻧﻮاﺣﯽ ﭘﺮوﺗﺌﯿﻨﯽ ﺑﺎ اﺑﻌﺎد ﮐﻮﭼﮏ را ﺷﻨﺎﺳﺎﯾﯽ ﮐﻨﺪ
ﻫﺎي ﭘﯿﺸﺮﻓﺘﻪ ﭘﺮدازش ﺳﯿﮕﻨﺎل ﺑﺎ اﻟﮕﻮرﯾﺘﻢ ﭘﯿﺸﻨﻬﺎدي ﻣﯽﺗﻮاﻧﺪ ﻣﻨﺠﺮ
0.25 0.25 0.25 0.25
ﺑﻪ ﺷﻨﺎﺳﺎﯾﯽ دﻗﯿﻖﺗﺮ ﻣﻮﻗﻌﯿﺖ ﻧﻮاﺣﯽ ﮐﺪﮐﻨﻨﺪه ﭘﺮوﺗﺌﯿﻦ ﺑﺮاي ﻫﺮﻧﻤﻮﻧﻪ
Frequency (%)
Frequency (%)
0.2 0.2 0.2 0.2
0.4
0.2 0 0 0 0
A CGT A CGT ACGT A CGT
0.1
()اﻟﻒ
0
0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000
Relative base location, n All positions 1st positions 2nd postitions 3rd positions
0.35 0.35 0.35 0.35
()اﻟﻒ
0.3 0.3 0.3 0.3
AF016052
1.4
Frequency (%)
CodingRegion
1 0.2 0.2 0.2 0.2
0.8
0.15 0.15 0.15 0.15
0.6
0.2
0.05 0.05 0.05 0.05
0
0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000
Relative base location, n
0 0 0 0
ACGT ACGT ACGT ACGT
( )ب
AF019074.1 ()ب
0.7
DFT
0.6 Proposed method
CodingRegion
Period-3 power spectrum
0.5
0.4
0.3
0.2
0.1
0
0 1000 2000 3000 4000 5000 6000 7000
Relative base location, n
()ج
5
AF019074.1 AF009962
0.5 0.35
DFT DFT
Proposed method 0.3 Proposed method
0.4
Period-3 power spectrum
CodingRegion CodingRegion
0.2 0.15
0.1
0.1
0.05
0
0 1000 2000 3000 4000 5000 6000 7000 0
Relative base location, n 0 1000 2000 3000 4000 5000 6000 7000 8000
Relative base location, n
()ج
() د
AF009962 AJ223321.1
0.35
0.12
DFT
DFT
0.3 Proposed method
0.1 Proposed method
CodingRegion
0.25
0.08
0.2
0.06
0.15
0.04 0.1
0.02 0.05
0
0 0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000
0 1000 2000 3000 4000 5000 6000 7000 8000 Relative base location, n
Relative base location, n
() ه
()د و اﻟﮕﻮرﯾﺘﻢ ﭘﯿﺸﻨﻬﺎدي ﺑﺎ اﻧﺘﺨﺎب ﭘﻨﺠﺮهDFT ﻣﻘﺎﯾﺴﻪ روش: 6ﺷﮑﻞ
AJ223321.1 ( ج،AF016052 ( ب،F56F11.4 ( اﻟﻒ:ﻣﺴﺘﻄﯿﻠﯽ در ژنﻫﺎي
0.12
DFT .AJ223321.1 ( د،AF009964 ( د،AF019074.1
Proposed method
0.1 CodingRegion
Period-3 power spectrum
F56F11.4
0.08
0.35
DFT
0.06 0.3 Proposed method
Period-3 power spectrum
CodingRegion
0.25
0.04
0.2
0.02
0.15
0 0.1
0 500 1000 1500 2000 2500 3000 3500 4000 4500 5000
Relative base location, n
0.05
( )ه 0
0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000
Relative base location, n
CodingRegion
0.3
ﻣﺮاﺟﻊ 0.2
[1] Snustad D.P. and Simmons M.J., Principles of Genetics, John 0.1
Wiley & Sons Inc., 2000.
[2] Dougherty E. R, et al., Genomic signal processing and 0
0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000
statistics, EURASIP Book Series on Signal Processing and Relative base location, n
Communications, 2005.
( )ب
[3] Trinfonov EN, “3- 10.5-, 200- and 400 base periodicities in
genome sequences,” Physica A, vol. 249, pp. 511-516, 1998.
[4] Wan X.F., Xu D., Kleinhofs A. and Zhou J., “Quantitative
relationship between synonymous codon usage bias and GC
composition across unicellular genomes”, BMC Evolutionary
Biology, vol. 4, no. 19, 2004.
6