Download as pdf or txt
Download as pdf or txt
You are on page 1of 9

‫ﯾﻮﻧﯽﮐﺪ‬

‫داﻧﺸﻨﺎﻣﻪ آزاد‬
‫ٔ‬ ‫از وﯾﮑﯽﭘﺪﯾﺎ‪،‬‬

‫ﯾﻮﻧﯽﮐﺪ‬ ‫ﯾﻮﻧﯽ ُﮐﺪ]‪) [۱‬ﺑﻪ اﻧﮕﻠﯿﺴﯽ‪ (Unicode :‬اﺳﺘﺎﻧﺪاردی ﺑﺮای ﮐُﺪ ﮐﺮدن‬
‫ﻧﻮﯾﺴﻪﻫﺎی راﯾﺎﻧﻪای و ﻧﻤﺎﯾﺶ و ﭘﺮدازش ﻣﺘﻦ ﺑﻪ اﮐﺜﺮ زﺑﺎنﻫﺎی دﻧﯿﺎ]‪[۲‬‬
‫اﺳﺖ‪ .‬ﻫﺮ زﺑﺎن ﯾﮏ ﻗﺎﻟﺐ ﯾﻮﻧﯽﮐﺪ دارد‪.‬‬

‫اﯾﻦ اﺳﺘﺎﻧﺪارد ﻫﻤﺎﻫﻨﮓ ﺑﺎ ﻣﺠﻤﻮﻋﻪ ﺟﻬﺎﻧﯽ ﻧﻮﯾﺴﻪﻫﺎ ﺗﺄﻟﯿﻒ ﺷﺪهاﺳﺖ و ﺑﻪ‬


‫ﺻﻮرت ﮐﺘﺎﺑﯽ ﺑﻪ ﻧﺎم '‪ 'The Unicode Standard‬ﻣﻨﺘﺸﺮ ﺷﺪهاﺳﺖ‪ .‬آﺧﺮﯾﻦ‬
‫وﯾﺮاﯾﺶ اﯾﻦ اﺳﺘﺎﻧﺪارد ﺷﺎﻣﻞ ﺑﯿﺶ از ‪ ۱۱۰۰۰۰‬ﻧﻮﯾﺴﻪ و ‪ ۱۰۰‬ﻧﻤﺎد‪،‬‬
‫ﻣﺠﻤﻮﻋﻪای از ﻧﻤﻮدارﻫﺎی ﮐﺪ ﺑﺮای ﻣﺮﺟﻊ ﺗﺼﻮﯾﺮی‪ ،‬روش رﻣﺰﮔﺬاری و‬
‫ﻣﺠﻤﻮﻋﻪای از اﺳﺘﺎﻧﺪارد رﻣﺰﮔﺬاری ﮐﺎراﮐﺘﺮ‪ ،‬ﺷﻤﺎرش ﺧﻮاص ﺷﺨﺼﯿﺖ‬
‫ﻣﺎﻧﻨﺪ ﺣﺮوف ﺑﺰرگ و ﮐﻮﭼﮏ‪ ،‬ﻣﺠﻤﻮﻋﻪای از ﻣﺮﺟﻊ ﻓﺎﯾﻞﻫﺎی دادهﻫﺎی‬
‫ﮐﺎﻣﭙﯿﻮﺗﺮ و ﺗﻌﺪادی ﻣﻮارد ﻣﺮﺑﻮط ﻣﺎﻧﻨﺪ ﺟﺰﺋﯿﺎت ﻧﻮﯾﺴﻪ‪ ،‬ﺑﺮاﺑﺮی ﯾﻮﻧﯽ ﮐﺪ‪،‬‬
‫رﻧﺪر ﮐﺮدن‪ ،‬ﻧﻈﻢ و ﺻﻔﺤﻪ ﻧﻤﺎﯾﺶ دو ﺟﻬﺘﻪ )ﺑﺮای ﻧﻤﺎﯾﺶ ﺻﺤﯿﺢ ﻣﺘﻦ‬
‫ﺣﺎوی اﺳﮑﺮﯾﭙﺖ راﺳﺖ ﺑﻪ ﭼﭗ ﻣﺎﻧﻨﺪ ﻋﺮﺑﯽ‪ ،‬ﻓﺎرﺳﯽ و ﻋﺒﺮی‪ ،‬و‬
‫اﺳﮑﺮﯾﭙﺖﻫﺎی ﺳﻤﺖ ﭼﭗ ﺑﻪ راﺳﺖ( ﻣﯽﺑﺎﺷﺪ‪ .‬ﺗﺎ ﺗﺎرﯾﺦ ﻣﺎرس ‪ ،۲۰۱۹‬آﺧﺮﯾﻦ‬
‫وﯾﺮاﯾﺶ‪ ،‬ﯾﻮﻧﯿﮑﺪ ‪ ۱۲ ۰‬اﺳﺖ‪.‬‬

‫ﻣﻮﻓﻘﯿﺖ ﯾﻮﻧﯿﮑﺪ در ﯾﮑﯽ ﮐﺮدن ﮐﺪ ﺑﻨﺪی ﻧﻮﯾﺴﻪﻫﺎ ﺳﺒﺐ اﺳﺘﻔﺎده ﮔﺴﺘﺮده‬


‫اش در ﺟﻬﺎﻧﯽﺳﺎزی و ﺑﻮﻣﯽﺳﺎزی ﻧﺮماﻓﺰارﻫﺎ ﺷﺪهاﺳﺖ‪ .‬اﯾﻦ اﺳﺘﺎﻧﺪارد‬
‫ﻧﺸﺎنواره اﺋﺘﻼف ﯾﻮﻧﯽﮐﺪ‬ ‫در ﺑﺴﯿﺎری از ﻓﻨﺎوریﻫﺎی اﺧﯿﺮ ﭘﯿﺎده ﺷﺪهاﺳﺖ از ﺟﻤﻠﻪ‪ :‬اﮐﺲ ام ال‪،‬‬
‫ﻧﻮﯾﺴﻪ ﺟﻬﺎﻧﯽ )‪(UCS‬‬
‫ٔ‬ ‫ﻣﺠﻤﻮﻋﻪ‬ ‫ﻧﺎم)ﻫﺎی(دﯾﮕﺮ‬ ‫زﺑﺎن ﺑﺮﻧﺎﻣﻪﻧﻮﯾﺴﯽ ﺟﺎوا‪ ،‬ﭼﺎرﭼﻮب دات ﻧﺖ ﻣﺎﯾﮑﺮوﺳﺎﻓﺖ و ﺳﯿﺴﺘﻢ‬
‫ﺑﯿﻦاﻟﻤﻠﻠﯽ‬ ‫زﺑﺎن)ﻫﺎ(‬ ‫ﻋﺎﻣﻞﻫﺎی ﻣﺪرن‪.‬‬
‫اﺳﺘﺎﻧﺪارد ﯾﻮﻧﯽﮐﺪ‬ ‫اﺳﺘﺎﻧﺪارد‬ ‫ﯾﻮﻧﯿﮑﺪ ﻣﯽﺗﻮاﻧﺪ ﺗﻮﺳﻂ ﮐﺪﺑﻨﺪیﻫﺎی ﻣﺨﺘﻠﻔﯽ ﭘﯿﺎدهﺳﺎزی ﺷﻮد‪.‬‬
‫‪UTF-8, UTF-16, GB18030‬‬ ‫ﻓﺮﻣﺖﻫﺎی‬ ‫ﭘﺮﮐﺎرﺑﺮدﺗﺮﯾﻦ رﻣﺰ ﻧﮕﺎریﻫﺎ ﻋﺒﺎرت اﻧﺪ از‪ ،UTF-8 :‬و ‪ UCS-2‬ﮐﻪ دﯾﮕﺮ‬
‫‪Less common: UTF-32, BOCU,‬‬ ‫رﻣﺰﮔﺬاری ﺷﺪه‬ ‫اﻋﺘﺒﺎر ﻧﺪارد‪ ،‬و ‪UTF-16‬‬
‫‪SCSU, UTF-7‬‬
‫ﮐﺪﺑﻨﺪی ‪ UTF-8‬ﺑﺮای ﮐﺪﺑﻨﺪیﻫﺎی ﻣﻮﺟﻮد در اﺳﺘﺎﻧﺪارد اﺳﮑﯽ ﺗﻨﻬﺎ ‪۱‬‬
‫‪ ISO 8859‬و ﺑﺴﯿﺎری دﯾﮕﺮ‬ ‫ﭘﺲ از‬ ‫ﺑﺎﯾﺖ اﺳﺘﻔﺎده ﻣﯽﮐﻨﺪ‪ .‬ﮐﺪ ﻧﻮﯾﺴﻪﻫﺎی ﻣﻮﺟﻮد در رﻣﺰ ﻧﮕﺎری اﺳﮑﯽ‪ ،‬در ﻫﺮ‬
‫دو ﮐﺪﺑﻨﺪی ﯾﮑﯽ اﺳﺖ‪ .‬اﯾﻦ رﻣﺰ ﻧﮕﺎری ﺣﺪاﮐﺜﺮ ‪ ۴‬ﺑﺎﯾﺖ ﺑﺮای ﻫﺮ ﻧﻮﯾﺴﻪ‬
‫اﺳﺘﻔﺎده ﻣﯽﮐﻨﺪ‪ UCS-2.‬ﺑﺮای ﺗﻤﺎم ﻧﻮﯾﺴﻪﻫﺎ از ‪ ۲‬ﺑﺎﯾﺖ اﺳﺘﻔﺎده ﻣﯽﮐﻨﺪ ﺑﻨﺎﺑﺮاﯾﻦ ﻧﻤﯽﺗﻮاﻧﺪ ﺗﻤﺎم ﻧﻮﯾﺴﻪﻫﺎی ﻣﻮﺟﻮد در اﺳﺘﺎﻧﺪارد ﻓﻌﻠﯽ‬
‫ﯾﻮﻧﯿﮑﺪ را ﮐﺪﺑﻨﺪی ﮐﻨﺪ‪ UTF-16 .‬ﮐﺪﺑﻨﺪی ‪ UCS-2‬را ﮔﺴﺘﺮش ﻣﯽدﻫﺪ و ﺑﺮای ﻧﻮﯾﺴﻪﻫﺎی ﺑﺎﻗﯽﻣﺎﻧﺪه از ‪ ۴‬ﺑﺎﯾﺖ اﺳﺘﻔﺎده ﻣﯽﮐﻨﺪ‪.‬‬

‫ﻣﺤﺘﻮﯾﺎت‬
‫ﺗﺎرﯾﺨﭽﻪ و ﺗﻮﺳﻌﻪ‬
‫ﻧﺴﺨﻪ ﻫﺎ‬

‫ﯾﻮﻧﯿﮑﺪ در وﯾﻨﺪوز‬

‫ﺟﺴﺘﺎرﻫﺎی واﺑﺴﺘﻪ‬

‫ﭘﯿﻮﻧﺪ ﺑﻪ ﺑﯿﺮون‬

‫ﭘﺎﻧﻮﯾﺲ‬

‫ﻣﻨﺎﺑﻊ‬
‫ﺗﺎرﯾﺨﭽﻪ و ﺗﻮﺳﻌﻪ‬
‫ﻫﺪف ﯾﻮﻧﯿﮑﺪ رﻓﻊ ﻣﺤﺪودﯾﺖﻫﺎی ﻣﻮﺟﻮد در ﮐﺪﺑﻨﺪی ﻧﻮﯾﺴﻪﻫﺎی ﻗﺪﯾﻤﯽ اﺳﺖ‪ ،‬ﻣﺎﻧﻨﺪ ﮐﺪﺑﻨﺪیﻫﺎﯾﯽ ﮐﻪ ﺑﺮ ﭘﺎﯾﻪ اﺳﺘﺎﻧﺪارد ‪ISO 8859‬‬
‫ﺗﻌﺮﯾﻒ ﺷﺪهاﻧﺪ‪ ،‬ﮐﻪ اﺳﺘﻔﺎده ﮔﺴﺘﺮدهای در ﮐﺸﻮرﻫﺎی ﻣﺨﺘﻠﻒ ﭘﯿﺪا ﮐﺮدهاﻧﺪ‪ ،‬وﻟﯽ ﺑﺎ ﯾﮑﺪﯾﮕﺮ ﺳﺎزﮔﺎر ﻧﯿﺴﺘﻨﺪ‪ .‬ﺑﺴﯿﺎری از ﮐﺪﺑﻨﺪیﻫﺎی‬
‫ﻗﺪﯾﻤﯽ اﯾﻦ ﻣﺸﮑﻞ ﻣﺸﺘﺮک را دارﻧﺪ ﮐﻪ اﻣﮑﺎن ﭘﺮدازش ﻣﺘﻦﻫﺎی دوزﺑﺎﻧﻪ )ﻣﻌﻤﻮﻻ ﺑﻪ وﺳﯿﻠﻪ ﻧﻮﯾﺴﻪﻫﺎی ﻻﺗﯿﻦ و ﻧﻤﺎدﻫﺎی ﻣﺤﻠﯽ( را ﻓﺮاﻫﻢ‬
‫ﻣﯽﮐﻨﻨﺪ‪ ،‬وﻟﯽ ﭘﺮدازش ﺑﯿﺶ از دو زﺑﺎن را ﻣﻤﮑﻦ ﻧﻤﯽﮐﻨﻨﺪ‪.‬‬

‫ﻧﻘﺶ ﯾﻮﻧﯿﮑﺪ در ﭘﺮدازش ﻣﺘﻦ اﯾﻦ اﺳﺖ ﮐﻪ ﺑﻪ ﺟﺎی ﯾﮏ ﺗﺼﻮﯾﺮ ﺑﺮای ﻫﺮ ﻧﻮﯾﺴﻪ ﯾﮏ ﮐﺪ ﻣﻨﺤﺼﺮ ﺑﻪ ﻓﺮد اراﺋﻪ ﻣﯽﮐﻨﺪ‪ .‬ﺑﻪ ﻋﺒﺎرت دﯾﮕﺮ‪،‬‬
‫ﯾﻮﻧﯿﮑﺪ ﯾﮏ ﻧﻮﯾﺴﻪ را ﺑﻪ ﺻﻮرت ﻣﺠﺎزی اراﺋﻪ ﻣﯽﮐﻨﺪ و ﮐﺎر ﺳﺎﺧﺖ ﺗﺼﻮﯾﺮ )ﺷﺎﻣﻞ اﻧﺪازه‪ ،‬ﺷﮑﻞ‪ ،‬ﻗﻠﻢ‪ ،‬ﯾﺎ ﺳﺒﮏ( ﻧﻮﯾﺴﻪ را ﺑﻪ ﻋﻬﺪه‬
‫ﻧﺮماﻓﺰار دﯾﮕﺮی ﻣﺎﻧﻨﺪ ﻣﺮورﮔﺮ وب ﯾﺎ واژه ﭘﺮداز ﻣﯽﮔﺬارد‪.‬‬

‫ﻧﺴﺨﻪ ﻫﺎ‬

‫ﯾﻮﻧﯿﮑﺪ در ﮐﻨﺎر ﺳﺎزﻣﺎن ﺑﯿﻦ اﻟﻤﻠﻠﯽ اﺳﺘﺎﻧﺪارد ﺗﻮﺳﻌﻪ ﯾﺎﻓﺘﻪ اﺳﺖ و ﮐﺎرﻧﺎﻣﻪ ﮐﺎراﮐﺘﺮی ﺧﻮد را ﺗﺤﺖ ‪ ISO / IEC 10646‬ﺑﺎ دﯾﮕﺮان ﺑﻪ‬
‫اﺷﺘﺮاک ﻣﯽ ﮔﺬارد‪ :‬ﻣﺠﻤﻮﻋﻪ ﮐﺎراﮐﺘﺮ ﺟﻬﺎﻧﯽ‪ .‬ﯾﻮﻧﯿﮑﺪ و ‪ ISO / IEC 10646‬در ﮐﻨﺎر ﺑﮑﺪﯾﮕﺮ و ﻫﻤﺴﺎن ﻫﻢ ﺑﻪ ﻋﻨﻮان رﻣﺰﮔﺬاری ﮐﺎراﮐﺘﺮ‬
‫ﻋﻤﻞ ﻣﯽ ﮐﻨﻨﺪ‪ .‬اﻣﺎ اﺳﺘﺎﻧﺪارد ﯾﻮﻧﯿﮑﺪ ﺣﺎوی اﻃﻼﻋﺎت ﺑﺴﯿﺎر ﺑﯿﺸﺘﺮی ﺑﺮای ﭘﯿﺎده ﺳﺎز اﺳﺖ‪ ،‬و ﺟﺰﺋﯿﺎت ﺑﯿﺸﺘﺮی در راﺑﻄﻪ از ﻗﺒﯿﻞ‬
‫رﻣﺰﮔﺬاری ﺑﯿﺘﯽ ‪ ،‬ﺟﻤﻊ ﺑﻨﺪی و رﻧﺪر ﮐﺎراﮐﺘﺮﻫﺎ را ﺷﺎﻣﻞ ﻣﯽ ﺷﻮد‪ .‬اﺳﺘﺎﻧﺪارد ﯾﻮﻧﯿﮑﺪ ﺗﻌﺪاد زﯾﺎدی از ﺧﺼﻮﺻﯿﺎت ﮐﺎراﮐﺘﺮﻫﺎ را ﺑﺮ ﻣﯽ‬
‫ﺷﻤﺎرد‪ ،‬ﻣﻦ ﺟﻤﻠﻪ ﭘﺸﺘﯿﺒﺎﻧﯽ از ﺟﻬﺖ ﻧﻮﺷﺘﻦ ﻣﺘﻦ دوﺳﻮﯾﻪ اﺳﺖ‪ .‬اﺻﻄﻼﺣﺎت ﻣﻮرد اﺳﺘﻔﺎده اﯾﻦ دو اﺳﺘﺎﻧﺪارد از ﮐﻤﯽ ﺗﻔﺎوت ﺑﺮﺧﻮردار‬
‫اﺳﺖ‪.‬‬

‫ﮐﻨﺴﺮﺳﯿﻮم ﯾﻮﻧﯿﮑﺪ ﺑﺮای اوﻟﯿﻦ ﺑﺎر ‪ Unicode Standard‬را در ﺳﺎل ‪ 1991‬ﻣﻨﺘﺸﺮ ﮐﺮد )ﻧﺴﺨﻪ ‪ ، (1 0‬و از آن زﻣﺎن ﻧﺴﺨﻪ ﻫﺎی ﺟﺪﯾﺪ را‬
‫ﺑﻄﻮر ﻣﻨﻈﻢ ﻣﻨﺘﺸﺮ ﻣﯽ ﮐﻨﺪ‪ .‬آﺧﺮﯾﻦ ﻧﺴﺨﻪ ﯾﻮﻧﯿﮑﺪ اﺳﺘﺎﻧﺪارد ‪ ،‬ﻧﺴﺨﻪ ‪ ، 13 0‬در ﻣﺎرس ‪ 2020‬ﻣﻨﺘﺸﺮ ﺷﺪ و ﺑﺎ ﻓﺮﻣﺖ اﻟﮑﺘﺮوﻧﯿﮑﯽ از وب‬
‫ﺳﺎﯾﺖ ﮐﻨﺴﺮﺳﯿﻮم در دﺳﺘﺮس اﺳﺖ‪ .‬آﺧﺮﯾﻦ ﻧﺴﺨﻪ اﺳﺘﺎﻧﺪاردی ﮐﻪ ﺑﻪ ﻃﻮر ﮐﺎﻣﻞ در ﻗﺎﻟﺐ ﮐﺘﺎب ﻣﻨﺘﺸﺮ ﺷﺪه اﺳﺖ )ﺷﺎﻣﻞ ﻧﻤﻮدارﻫﺎی‬
‫ﮐﺪ( ﻧﺴﺨﻪ ‪ 5 0‬در ﺳﺎل ‪ 2006‬ﺑﻮد ‪ ،‬اﻣﺎ از ﻧﺴﺨﻪ ‪ (2009) 5 2‬ﻣﺸﺨﺼﺎت اﺻﻠﯽ اﺳﺘﺎﻧﺪارد ﺑﻪ ﻋﻨﻮان ﯾﮏ ﺷﻮﻣﯿﺰ ﭼﺎﭘﯽ در ﺻﻮرت‬
‫ﺗﻘﺎﺿﺎ ﻣﻨﺘﺸﺮ ﺷﺪه اﺳﺖ‪ .‬ﮐﻞ ﻣﺘﻦ ﻫﺮ ﻧﺴﺨﻪ اﺳﺘﺎﻧﺪارد از ﺟﻤﻠﻪ ﻣﺸﺨﺼﺎت اﺻﻠﯽ ‪ ،‬ﺿﻤﺎﺋﻢ اﺳﺘﺎﻧﺪارد و ﻧﻤﻮدار ﮐﺪ ﺑﻪ ﺻﻮرت آزاد در‬
‫ﻗﺎﻟﺐ ‪ PDF‬در وب ﺳﺎﯾﺖ ‪ Unicode‬در دﺳﺘﺮس اﺳﺖ]‪[۳‬‬

‫ﺗﺎﮐﻨﻮن ﻧﺴﺨﻪ ﻫﺎی اﺻﻠﯽ و ﺟﺰﺋﯽ زﯾﺮ از اﺳﺘﺎﻧﺪارد ﯾﻮﻧﯿﮑﺪ ﻣﻨﺘﺸﺮ ﺷﺪه اﺳﺖ‪ .‬ﻧﺴﺨﻪ ﻫﺎی ﺑﻪ روز ﺷﺪه ‪ ،‬ﮐﻪ ﻫﯿﭻ ﺗﻐﯿﯿﺮی در ﮐﺎرﻧﺎﻣﻪ‬
‫ﮐﺎرﮐﺘﺮﻫﺎ را ﺷﺎﻣﻞ ﻧﻤﯽ ﺷﻮد ‪ ،‬ﺑﺎ ﺷﻤﺎره ﺳﻮم )ﺑﻪ ﻋﻨﻮان ﻣﺜﺎل "ﻧﺴﺨﻪ ‪ ("4 0 1‬ﻋﻼﻣﺖ ﮔﺬاری ﻣﯽ ﺷﻮﻧﺪ و در ﺟﺪول زﯾﺮ ﺣﺬف ﻧﻤﯽ‬
‫ﺷﻮﻧﺪ]‪[۴‬‬
‫‪Unicode versions‬‬

‫ﮐﺎراﮐﺘﺮﻫﺎ‬

‫ﺟﻤﻊ‬ ‫‪Scripts‬‬ ‫ﻧﺴﺨﻪ ‪ ISO/IEC 10646‬ﻣﺘﻨﺎﻇﺮ‬ ‫ﮐﺘﺎب‬ ‫ﺗﺎرﯾﺦ‬ ‫ﻧﺴﺨﻪ‬


‫ﻧﺴﺨﻪ ﻫﺎی ﻣﻬﻢ‬ ‫ﺗﻌﺪادی]‪[tablenote ۱‬‬

‫ﻣﺠﻤﻮﻋﻪ اوﻟﯿﻪ ﺷﺎﻣﻞ ﮐﺎرﮐﺘﺮﻫﺎی زﯾﺮ‬


‫ﺑﻨﮕﺎﻟﯽ‪،‬‬ ‫ارﻣﻨﯽ‪،‬‬ ‫ﻋﺮﺑﯽ‪،‬‬ ‫اﺳﺖ‪:‬‬
‫ﺑﻮﭘﻮﻣﻮﻓﻮ‪ ،‬ﺳﯿﺮﯾﻠﯿﮏ‪ ،‬دﯾﻮاﻧﺎﮔﺮی‪،‬‬
‫ﺷﺎﺑﮏ‬
‫ﮔﺮﺟﺴﺘﺎﻧﯽ‪ ،‬ﯾﻮﻧﺎﻧﯽ و ﮐﭙﺘﯽ ‪,‬‬ ‫‪October‬‬
‫‪7,161‬‬ ‫‪24‬‬ ‫‪۰-۲۰۱-۵۶۷۸۸-۱‬‬ ‫‪100‬‬
‫ﮔﺠﺮاﺗﯽ‪ ،‬ﮔﺮﻣﮑﻬﯽ‪ ،‬ﻫﺎﻧﮕﻮﻟﯽ‪ ،‬ﻋﺒﺮی‪،‬‬ ‫‪1991‬‬
‫‪((Vol 1‬‬
‫ﻫﯿﺮاﮔﺎﻧﺎ‪ ،‬ﮐﺎﻧﺎدا‪ ،‬ﮐﺎﺗﺎﮐﺎﻧﺎ‪ ،‬ﻻﺋﻮ‪ ،‬ﻻﺗﯿﻦ‪،‬‬
‫ﻣﺎﻟﺰﯾﺎﯾﯽ‪ ،‬اودﯾﺎ‪،‬ﺗﺎﻟﯿﻢ‪ ،‬ﺗﻠﻮﮔﻮ‪ ،‬ﺗﺎی‪ ،‬و‬
‫ﺗﺒﺘﯽ ]‪[۵‬‬

‫ﺷﺎﺑﮏ‬
‫ﻣﺠﻤﻮﻋﻪ اﺑﺘﺪاﯾﯽ از ‪CJK Unified‬‬
‫‪ Ideographs‬ﺗﻌﺮﯾﻒ ﺷﺪ‪[۶].‬‬
‫‪28,359‬‬ ‫‪25‬‬ ‫‪۰-۲۰۱-۶۰۸۴۵-۶‬‬ ‫‪June 1992‬‬ ‫‪101‬‬
‫‪((Vol 2‬‬

‫‪ 4,306‬ﺳﯿﻼب دﯾﮕﺮ ﻫﺎﻧﮕﻮﻟﯽ ﺑﻪ‬


‫ﻣﺠﻤﻮﻋﻪ اﺑﺘﺪاﯾﯽ ‪ 2,350‬ﮐﺎرﮐﺘﺮی‬ ‫‪34,233‬‬ ‫‪24‬‬ ‫‪ISO/IEC 10646-1:1993‬‬ ‫‪June 1993‬‬ ‫‪11‬‬
‫اﺿﺎﻓﻪ ﺷﺪ‪ .‬ﺗﺒﺘﯽ ﺣﺬف ﺷﺪ‪[۷].‬‬

‫ﻣﺠﻤﻮﻋﻪ اﺻﻠﯿﺴﯿﻼب ﻫﺎی ﻫﺎﻧﮕﻮﻟﯽ‬


‫ﺣﺬف ﺷﺪ و ﯾﮏ ﻣﺠﻤﻮﻋﻪ ﺳﯿﻼب‬
‫‪ 11,172‬ﺗﺎﯾﯽ در ﻣﻮﻗﻌﯿﺖ ﺟﺪﯾﺪ‬
‫اﯾﺠﺎد ﺷﺪ‪ .‬ﺗﺒﺘﯽ ﺑﺎ ﻣﺠﻮﻋﻪ ﺟﺪﯾﺪ و‬
‫درﻣﮑﺎن ﻣﺘﻔﺎوت دوﺑﺎره اﺿﺎﻓﻪ ﺷﺪ‪.‬‬ ‫ﺷﺎﺑﮏ‬
‫‪ISO/IEC 10646-1:1993 plus‬‬
‫‪38,950‬‬ ‫‪25‬‬ ‫‪July 1996‬‬ ‫‪20‬‬
‫ﻣﮑﺎﻧﯿﺰم ﺟﺎﯾﮕﺰﯾﻨﯽ ﺑﺮای‬ ‫‪Amendments 5, 6 and 7‬‬ ‫‪۰-۲۰۱-۴۸۳۴۵-۹‬‬
‫ﺷﺪ‪.‬‬ ‫ﺗﻌﺮﯾﻒ‬ ‫ﮐﺎراﮐﺘﺮﻫﺎ‬
‫ﺻﻔﺤﺎت ‪ 15‬و ‪ 16‬ﻣﻨﻄﻘﻪ‬
‫اﺳﺘﻔﺎده ﺷﺨﺼﯽ ﺗﻌﯿﯿﻦ‬
‫ﺷﺪ‪[۸].‬‬

‫‪ISO/IEC 10646-1:1993 plus‬‬


‫‪Object‬‬ ‫و‬ ‫ﯾﻮرو‬ ‫ﻧﺸﺎﻧﻪ‬
‫‪Amendments 5, 6 and 7, as‬‬
‫‪ Replacement Character‬اﺿﺎﻓﻪ‬ ‫‪38,952‬‬ ‫‪25‬‬ ‫‪May 1998‬‬ ‫‪21‬‬
‫ﺷﺪﻧﺪ‪[۹].‬‬ ‫‪well as two characters from‬‬
‫‪Amendment 18‬‬

‫ﭼﺮوﮔﮑﯽ‪ ،‬ﮔﻌﺰ‪ ،‬ﺧﻤﺮی‪ ،‬ﻣﻐﻮﻟﯽ‪ ،‬ﺑﺮﻣﻪ‬


‫ای‪ ،‬اوﻗﺎم‪ ،‬ﺧﻂ روﻧﯽ‪ ،‬ﺳﯿﻨﻬﺎﻻ‪،‬‬
‫ﺳﺮﯾﺎﻧﯽ‪ ،‬ﺗﻬﺎﻧﺎ‪ ،‬ﺳﯿﻼب ﻫﺎی ﻣﺸﺘﺮک‬ ‫ﺷﺎﺑﮏ‬ ‫‪September‬‬
‫‪49,259‬‬ ‫‪38‬‬ ‫‪ISO/IEC 10646-1:2000‬‬ ‫‪30‬‬
‫ﻏﯿﺮﺑﻮﻣﯽ ﮐﺎﻧﺎداﯾﯽ ‪ and‬ﯾﯽ و‬ ‫‪۰-۲۰۱-۶۱۶۳۳-۵‬‬ ‫‪1999‬‬
‫ﻫﻤﭽﻨﯿﻦ اﻟﮕﻮﻫﺎی ﺑﺮﯾﻞ ﻧﯿﺰ اﺿﺎﻓﻪ‬
‫ﺷﺪﻧﺪ‪[۱۰].‬‬

‫دﺳﺮت‪ ,‬ﮔﻮﺗﯿﮏ‪ ،‬اﯾﺘﺎﻟﯿﺎﯾﯽ ﺑﺎﺳﺘﺎﻧﯽ‪،‬‬


‫‪ISO/IEC 10646-1:2000‬‬
‫ﻧﻤﺎدﻫﺎﯾﯽ از ﻣﻮﺳﯿﻘﯽ ﻏﺮﺑﯽ و‬ ‫‪March‬‬
‫‪94,205‬‬ ‫‪41‬‬ ‫‪31‬‬
‫ﺑﯿﺰاﻧﺴﯽ و ‪CJK Unified 42711‬‬ ‫‪ISO/IEC 10646-2:2001‬‬ ‫‪2001‬‬
‫‪ Ideographs‬اﺿﺎﻓﻪ ﺷﺪﻧﺪ‪[۱۱].‬‬
‫ﻓﯿﻠﯿﭙﯿﻨﯽ‪ ،‬ﺑﻮﯾﺪ‪ ،‬ﻫﺎوﻧﻮ‪ ،‬ﺗﺎﮔﺎﻟﻮگ‪ ،‬و‬ ‫‪95,221‬‬ ‫‪45‬‬ ‫‪ISO/IEC 10646-1:2000 plus‬‬ ‫‪March‬‬ ‫‪32‬‬
‫ﺗﺎﮔﺒﺎﻧﻮا اﺿﺎﻓﻪ ﺷﺪ‪[۱۲].‬‬ ‫‪2002‬‬
‫‪Amendment 1‬‬

‫‪ISO/IEC 10646-2:2001‬‬

‫ﺧﻄﯽ‪،‬‬ ‫‪B‬‬ ‫ﻟﯿﻤﺒﻮ‪،‬‬ ‫ﺳﯿﭙﺮوﯾﯿﺖ‪،‬‬


‫ﺷﺎﺑﮏ‬ ‫‪April‬‬
‫ﻋﺜﻤﺎﻧﯽ‪،‬ﺷﺎوﯾﺎن‪ ،‬ﺗﺎی ﻟﻪ‪ ،‬اوﮔﺎرﺗﯽ‪ ،‬و‬ ‫‪96,447‬‬ ‫‪52‬‬ ‫‪ISO/IEC 10646:2003‬‬ ‫‪40‬‬
‫ﺷﺶ ﻧﻮﯾﺴﯽ اﺿﺎﻓﻪ ﺷﺪﻧﺪ‪[۱۳].‬‬ ‫‪۰-۳۲۱-۱۸۵۷۸-۱‬‬ ‫‪2003‬‬

‫ﺑﻮﮔﯿﻨﯿﺰ‪ ،‬ﮔﻼﮔﻮﻟﯿﺘﯽ‪ ،‬ﺧﺮوﺷﺘﯽ‪،‬ﺗﺎی‬


‫ﻟﻮ‪ ،‬ﻓﺎرﺳﯽ ﺑﺎﺳﺘﺎﻧﯽ‪ ،‬ﺳﯿﻠﻬﺘﯽ‪ ،‬و‬
‫ﺗﯿﻔﯿﻨﺎگ اﺿﺎﻓﻪ ﺷﺪﻧﺪ‪ .‬ﮐﭙﺘﯽ از‬ ‫‪ISO/IEC 10646:2003 plus‬‬ ‫‪March‬‬
‫‪97,720‬‬ ‫‪59‬‬ ‫‪41‬‬
‫ﯾﻮﻧﺎﻧﯽ ﺟﺪاﺷﺪ‪ .‬اﻋﺪاد و ﻧﺸﺎﻧﻪ ﻫﺎی‬ ‫‪Amendment 1‬‬ ‫‪2005‬‬
‫ﻣﻮﺳﯿﻘﯿﺎﯾﯽ ﯾﻮﻧﺎن ﺑﺎﺳﺘﺎن ﻧﯿﺰ‬
‫اﺿﺎﻓﻪ ﺷﺪﻧﺪ ]‪[۱۴‬‬

‫‪ISO/IEC 10646:2003 plus‬‬


‫ﺑﺎﻟﯿﺎﯾﯽ‪ ،‬ﺧﻂ ﻣﯿﺨﯽ‪،‬اﻧﮑﻮ‪ ،‬ﭘﺎﺳﭙﺎ‪ ،‬و‬ ‫‪Amendments 1 and 2, as well‬‬ ‫ﺷﺎﺑﮏ‬
‫ﻓﯿﻨﯿﻘﯽ اﺿﺎﻓﻪ ﺷﺪ‪[۱۵].‬‬
‫‪99,089‬‬ ‫‪64‬‬ ‫‪July 2006‬‬ ‫‪50‬‬
‫‪as‬‬ ‫‪four‬‬ ‫‪characters‬‬ ‫‪from‬‬ ‫‪۰-۳۲۱-۴۸۰۹۱-۰‬‬
‫‪Amendment 3‬‬

‫ﮐﺎرﯾﺎن‪ ،‬ﭼﺎم‪ ،‬ﮐﺎﯾﺎ ﻟﯽ‪،‬ﻟﭗ ﭼﺎ‪،‬ﻟﯿﺴﯽ‪،‬‬


‫رﺟﻨﮓ‪،‬‬ ‫اوﻟﭽﯿﮑﯽ‪،‬‬ ‫ﻟﯿﺪی‪،‬‬
‫و‬ ‫وای‪،‬‬ ‫ﺷﻮراﺷﺘﺮا‪،‬ﺳﺎﻧﺪاﻧﯽ‪،‬‬
‫ﻫﻤﭽﻨﯿﻦ ﻧﺸﺎﻧﻪ ﻫﺎﯾﯽ از ﺻﻔﺤﻪ‬
‫ﻓﺴﺘﻮس‪ ،‬ﻣﺎژوﻧﮓ‪ ،‬دوﻣﯿﻨﻮ اﺿﺎﻓﻪ‬
‫‪ISO/IEC 10646:2003 plus‬‬ ‫‪April‬‬
‫ﺷﺪ‪.‬‬ ‫‪100,713‬‬ ‫‪75‬‬ ‫‪51‬‬
‫‪Amendments 1, 2, 3 and 4‬‬ ‫‪2008‬‬
‫ﺑﻪ ﻋﻼوه اﺿﺎﻓﺎﺗﯽ از ﺑﺮﻣﻪ‬
‫ای‪ ،‬اﺧﺘﺼﺎرات ﮐﺘﺎﺑﯽ‪ ،‬و ﻧﺴﺦ‬
‫ﺧﻄﯽ ﻣﯿﺎﻧﻪ‪ ،‬و ﺣﺮف ﺑﺰرگ ‪ẞ‬‬
‫راﻧﯿﺰ در ﺑﺮ داﺷﺖ‪[۱۶].‬‬

‫اوﺳﺘﺎﯾﯽ‪ ،‬ﺑﺎﻣﻮم‪ ،‬ﻫﯿﺮوﮔﻠﯿﻒ ﻣﺼﺮی‬


‫) در ﻣﺠﻤﻮﻋﻪ ﻧﺸﺎﻧﻪ ﻫﺎی ﮔﺎردﯾﻨﺮ‬
‫‪ 1071‬ﮐﺎراﮐﺘﺮ وﺟﻮد دارد(‪ ،‬آراﻣﯽ‬
‫ﭘﺎدﺷﺎﻫﯽ‪ ،‬ﭘﻬﻠﻮی ﻧﻮﺷﺘﺎری‪ ،‬ﭘﺎرﺗﯽ‬
‫ﻧﻮﺷﺘﺎری‪ ،‬ﺟﺎوه ای‪ ،‬ﮐﺎﯾﺘﯽ‪ ،‬ﻓﺮاﺳﺮ‪،‬‬
‫‪ISO/IEC 10646:2003 plus‬‬
‫ﻣﯿﺘﺌﯽ‪ ،‬ﻋﺮﺑﺴﺘﺎﻧﯽ ﺟﻨﻮﺑﯽ ﺑﺎﺳﺘﺎﻧﯽ‪،‬‬ ‫ﺷﺎﺑﮏ‬ ‫‪October‬‬
‫‪107,361‬‬ ‫‪90‬‬ ‫‪Amendments 1, 2, 3, 4, 5 and‬‬ ‫‪52‬‬
‫ﺗﺮﮐﯽ ﺑﺎﺳﺘﺎﻧﯽ )اورﺧﻮن(‪ ،‬ﺳﺎﻣﺮی‪،‬‬ ‫‪۹۷۸-۱-۹۳۶۲۱۳-۰۰-۹‬‬ ‫‪2009‬‬
‫‪6‬‬
‫ﺗﺎی ﺗﺎم‪ ،‬ﺗﺎی وﯾﺖ اﺿﺎﻓﻪ ﺷﺪ‪.‬‬
‫ﻫﻤﭽﻨﯿﻦ ‪CJK Unified 4149‬‬
‫‪ Ideographs‬ﺑﻪ ﻫﻤﺮاه ﺗﻮﺳﻌﻪ ﺟﺎﻣﻮ‬
‫ﮐﺎراﮐﺘﺮﻫﺎی‬ ‫و‬ ‫ﻫﺎﻧﮕﻮﻟﯽ‬ ‫ﺑﺮای‬
‫وردﯾﮑﺖ ﻧﯿﺰ اﺿﺎﻓﻪ ﺷﺪﻧﺪ‪[۱۷].‬‬

‫ﻣﺎﻧﺪاﯾﯽ‪،‬ﻋﻼﺋﻢ‬ ‫ﺑﺮاﻫﻤﯽ‪،‬‬ ‫ﺑﺘﮏ‪،‬‬ ‫‪109,449‬‬ ‫‪93‬‬ ‫‪ISO/IEC 10646:2010 plus the‬‬ ‫ﺷﺎﺑﮏ‬ ‫‪October‬‬ ‫‪60‬‬
‫راﻫﻨﻤﺎﯾﯽ و راﻧﻨﺪﮔﯽ‪ ،‬ﻧﻘﺸﻪ‪ ،‬ﻧﺸﺎﻧﻪ‬ ‫‪Indian rupee sign‬‬ ‫‪۹۷۸-۱-۹۳۶۲۱۳-۰۱-۶‬‬ ‫‪2010‬‬
‫ﻫﺎی ﺷﯿﻤﯿﺎﯾﯽ‪ ،‬ﺷﮑﻠﮏ ﻫﺎ‪ ،‬و ‪222‬‬
‫‪ CJK Unified Ideographs‬اﺿﺎﻓﻪ‬
‫ﺷﺪ‪[۱۸].‬‬

‫ﭼﺎﻣﮑﺎ‪ ،‬ﻣﺮوﺋﯿﺖ‪ ،‬ﭘﻮﻻرد‪ ،‬ﺷﺎرادا‪،‬‬


‫ﺷﺎﺑﮏ‬ ‫‪January‬‬
‫ﺳﺮﻧﮓ ﺳﻤﭙﻦ‪ ،‬و ﺗﮑﺮی اﺿﺎﻓﻪ‬ ‫‪110,181‬‬ ‫‪100‬‬ ‫‪ISO/IEC 10646:2012‬‬ ‫‪61‬‬
‫ﺷﺪﻧﺪ‪[۱۹].‬‬ ‫‪۹۷۸-۱-۹۳۶۲۱۳-۰۲-۳‬‬ ‫‪2012‬‬

‫‪ISO/IEC 10646:2012 plus the‬‬ ‫ﺷﺎﺑﮏ‬ ‫‪September‬‬


‫ﻧﺸﺎن ﻟﯿﺮه ﺗﺮﮐﯿﻪ اﺿﺎﻓﻪ ﺷﺪ‪[۲۰].‬‬ ‫‪110,182‬‬ ‫‪100‬‬ ‫‪62‬‬
‫‪Turkish lira sign‬‬ ‫‪۹۷۸-۱-۹۳۶۲۱۳-۰۷-۸‬‬ ‫‪2012‬‬

‫‪ 5‬ﮐﺎراﮐﺘﺮ ﺑﺮای ﻣﺘﻦ دوﺳﻮﯾﻪ اﺿﺎﻓﻪ‬ ‫‪ISO/IEC 10646:2012 plus six‬‬ ‫ﺷﺎﺑﮏ‬ ‫‪September‬‬
‫ﺷﺪ‪[۲۱].‬‬
‫‪110,187‬‬ ‫‪100‬‬ ‫‪63‬‬
‫‪characters‬‬ ‫‪۹۷۸-۱-۹۳۶۲۱۳-۰۸-۵‬‬ ‫‪2013‬‬

‫ﺑﺎﺳﺎ‪ ،‬آﻻﺑﺎﻧﯿﺎی ﻗﻔﻘﺎز‪ ،‬دوﭘﻠﻮﯾﺎن‪،‬‬


‫اﻟﺒﺎﺳﺎن‪ ،‬ﮔﺮاﻧﺘﺎ‪ ،‬ﺧﻮﺟﮑﯽ‪ ،‬ﺧﻮداﺑﺎدی‪،‬‬

‫ﺧﻄﯽ آ‪ ،‬ﻣﺎﻫﺎﺟﺎﻧﯽ‪ ،‬ﻣﺎﻧﻮی‪،‬‬


‫ﻣﻨﺪه ﮐﯿﮑﺎﮐﻮﯾﯽ‪ ،‬ﻣﻮدی‪ ،‬ﻣﺮو‪،‬‬ ‫‪ISO/IEC 10646:2012 plus‬‬
‫ﺷﺎﺑﮏ‬
‫ﻧﺒﻄﯽ‪ ،‬ﻋﺮﺑﯽ ﺷﻤﺎﻟﯽ ﺑﺎﺳﺘﺎﻧﯽ‪،‬‬ ‫‪113,021‬‬ ‫‪123‬‬ ‫‪Amendments 1 and 2, as well‬‬ ‫‪June 2014‬‬ ‫‪70‬‬
‫ﭘﺮﻣﯿﮏ ﺑﺎﺳﺘﺎﻧﯽ‪ ،‬ﭘﺎﻫﺎو‪،‬‬ ‫‪۹۷۸-۱-۹۳۶۲۱۳-۰۹-۲‬‬
‫‪as the Ruble sign‬‬
‫ﺗﺪﻣﯿﺮی‪ ،‬ﭘﻮ ﭼﯿﻦ ﻫﺎو‪ ،‬ﭘﻬﻠﻮی‬
‫ﻧﯿﺎﯾﺸﯽ‪ ،‬ﺳﯿﺪام‪ ،‬ﺗﯿﺮﻫﻮﺗﺎ‪،‬‬
‫واراﻧﮓ‪ ،‬ﻧﺸﺎن ﮔﺬارﻫﺎی‬
‫ﭘﺎرﮔﺮاﻓﯽ ]‪[۲۲‬‬

‫آﻫﻮم‪ ،‬آﻧﺎﺗﻮﻟﯽ‪ ،‬ﻫﺎﺗﺮان‪ ،‬ﻣﻮﻟﺘﺎﻧﯽ‪،‬‬


‫‪ISO/IEC 10646:2014 plus‬‬
‫ﻟﻬﺴﺘﺎﻧﯽ ﺑﺎﺳﺘﺎﻧﯽ‪ ،‬زﺑﺎن اﺷﺎره‪،‬‬
‫‪Amendment 1, as well as the‬‬
‫ﭼﺮوﮐﯽ ﻧﺸﺎﻧﻪ ای‪CJK 5771 ،‬‬ ‫ﺷﺎﺑﮏ‬
‫‪120,737‬‬ ‫‪129‬‬ ‫‪Lari sign, nine CJK unified‬‬ ‫‪June 2015‬‬ ‫‪80‬‬
‫‪ Unified Ideographs‬دﯾﮕﺮ‪ ،‬و‬ ‫‪۹۷۸-۱-۹۳۶۲۱۳-۱۰-۸‬‬
‫‪ideographs, and 41 emoji‬‬
‫ﻣﺠﻤﻮﻋﻪ ﮐﻮﭼﮏ ﻧﻮﯾﺴﯽ ﭼﺮوﮔﮑﯽ و‬ ‫‪[۲۳]characters‬‬
‫ﭘﻨﺞ ﻧﺸﺎﻧﻪ ﻣﻘﯿﺎس ﻓﯿﺘﺰﭘﺎﺗﺮﯾﮏ ]‪[۲۴‬‬

‫‪ISO/IEC 10646:2014 plus‬‬


‫ﺑﺎﯾﮑﺴﻮﮐﯽ‪ ،‬ژاﻧﮓ ژاﻧﮓ‪،‬‬ ‫آدﻻم‪،‬‬ ‫‪Amendments 1 and 2, as well‬‬
‫ﺷﺎﺑﮏ‬
‫ﺗﺎﻧﮕﻮت‪،‬‬ ‫اوﺳﺎژ‪،‬‬ ‫ﭘﺮاﮐﺎل‪،‬‬ ‫‪128,237‬‬ ‫‪135‬‬ ‫‪as Adlam, Newa, Japanese TV‬‬ ‫‪June 2016‬‬ ‫‪90‬‬
‫اﯾﻤﻮﺟﯽ ]‪[۲۷][۲۶‬‬ ‫‪۹۷۸-۱-۹۳۶۲۱۳-۱۳-۹‬‬
‫‪symbols, and 74 emoji and‬‬
‫‪[۲۵]symbols‬‬

‫‪ISO/IEC 10646:2017 plus 56‬‬


‫زاﻧﺎﺑﺎزار‪ ،‬ﺳﻮﯾﻮﻣﺒﻮ‪ ،‬ﻣﺎﺳﺎرام ﮔﻮﻧﺪی‪،‬‬
‫‪emoji‬‬ ‫‪characters,‬‬ ‫‪285‬‬
‫ﻧﻮﺷﻮ‪ ،‬ﻫﻨﺘﺎﯾﮕﺎﻧﺎ‪ ،‬ﻫﯿﺮاﮔﺎﻧﺎ‪7494 ،‬‬ ‫ﺷﺎﺑﮏ‬
‫‪136,755‬‬ ‫‪139‬‬ ‫‪hentaigana characters, and 3‬‬ ‫‪June 2017‬‬ ‫‪10 0‬‬
‫‪ CJK Unified Ideographs‬دﯾﮕﺮ‪،‬‬ ‫‪۹۷۸-۱-۹۳۶۲۱۳-۱۶-۰‬‬
‫‪Zanabazar‬‬ ‫‪Square‬‬
‫و اﯾﻤﻮﺟﯽ‬ ‫‪[۲۸]characters‬‬

‫دوﮔﺮی‪ ،‬ﺧﺪروﻟﯽ‪ ،‬ﮔﻮﻧﺠﺎﻻ‪ ،‬ﺣﻨﯿﻔﯽ‪،‬‬ ‫‪ISO/IEC 10646:2017 plus‬‬


‫اﯾﻨﺪی‪ ،‬ﻣﺎﮐﺎﺳﺎرس‪ ،‬ﻣﺪﻓﺪری‪ ،‬ﺳﻐﺪی‪،‬‬ ‫‪Amendment 1, as well as 46‬‬
‫‪CJK‬‬ ‫‪Unified‬‬ ‫‪5‬‬ ‫ﻣﺎﯾﺎ‪،‬‬ ‫‪Mtavruli Georgian capital‬‬ ‫ﺷﺎﺑﮏ‬
‫‪137,439‬‬ ‫‪146‬‬ ‫‪June 2018‬‬ ‫‪11 0‬‬
‫‪ Ideographs‬ﺑﺎ اوﻟﻮﯾﺖ ﺑﺎﻻ‪ ،‬ﻧﺸﺎﻧﻪ‬ ‫‪letters,‬‬ ‫‪5‬‬ ‫‪CJK‬‬ ‫‪unified‬‬ ‫‪۹۷۸-۱-۹۳۶۲۱۳-۱۹-۱‬‬
‫ﻫﺎی ﺷﻄﺮﻧﺞ ﭼﯿﻨﯽ‪ ،‬ﻧﺸﻨﻪ ﭘﻨﺞ‬ ‫‪ideographs, and 66 emoji‬‬
‫ﺳﺘﺎره‪ ،‬و ‪ 146‬اﯾﻤﻮﺟﯽ دﯾﮕﺮ]‪[۳۰‬‬ ‫‪[۲۹] characters‬‬

‫ﻧﯿﺎﮐﻨﮓ‪،‬‬ ‫ﻧﺎﻧﺪﯾﻨﺎﮔﺎری‪،‬‬ ‫اﻟﯿﻤﺎﯾﯽ‪،‬‬ ‫‪137,993‬‬ ‫‪150‬‬ ‫‪ISO/IEC 10646:2017 plus‬‬ ‫ﺷﺎﺑﮏ‬ ‫‪March‬‬ ‫‪12 0‬‬
‫واﻧﭽﻮ‪ ،‬ﭘﻮﻻرد اﺿﺎﻓﺎﺗﯽ ﺑﺮای ﻋﻼﻣﺖ‬ ‫‪Amendments 1 and 2, as well‬‬ ‫‪۹۷۸-۱-۹۳۶۲۱۳-۲۲-۱‬‬ ‫‪2019‬‬
‫ﻫﺎی زﺑﺎن ﯾﯽ و ﻣﯿﺎﺋﻮ ﭼﯿﻨﯽ‪ ،‬ﺣﺮوف‬ ‫‪as‬‬ ‫‪62‬‬ ‫‪additional‬‬
‫ﮐﻮﭼﮑﮋاﭘﻨﯽ ﻫﯿﺮاﮔﺎﻧﺎ و ﮐﺎﺗﺎﮐﺎﻧﺎ‪،‬‬ ‫‪[۳۱] characters‬‬

‫ﻧﺸﺎﻧﻪ ﻫﺎ و ﺷﺎﺧﻪ ﻫﺎی ﺗﺎرﯾﺨﯽ‬


‫ﺗﺎﻣﯿﻞ‪ ،‬ﺣﺮوف ﻻﺋﻮ ﺑﺮای ﭘﺎﻟﯽ‪،‬‬
‫ﺣﺮوف ﻻﺗﯿﻦ ﺑﺮای ﺣﺮف ﻧﻮﺷﺘﺎر‬
‫ﻣﺼﺮی و اوﮔﺎرﯾﺘﯿﮏ‪ ،‬ﻧﺸﺎﻧﻪ ای‬
‫ﻫﯿﺮوﮔﻠﯿﻒ‪ ،‬و ‪ 161‬اﯾﻤﻮﺟﯽ]‪[۳۲‬‬

‫اﻓﺰودن ﯾﮏ ﮐﺎرﮐﺘﺮ در ‪U+32FF‬‬ ‫ﺷﺎﺑﮏ‬


‫ﺑﺮای ﺷﮑﻞ ﻣﺮﺑﻊ اﺳﻢ رﯾﻮا ]‪[۳۳‬‬
‫‪137,994‬‬ ‫‪150‬‬ ‫‪May 2019‬‬ ‫‪12 1‬‬
‫‪۹۷۸-۱-۹۳۶۲۱۳-۲۵-۲‬‬

‫زﺑﺎن ﺧﻮارزﻣﯽ‪ ،‬دﯾﻮی‪ ،‬ﺧﯿﻄﺎن‪،‬‬


‫ﮐﻮردی ﯾﺰﯾﺪی‪ ،‬اﺿﺎﻓﺎت ﺳﺮی ‪G‬‬
‫‪،CJK‬‬ ‫‪Unified‬‬ ‫‪Ideographs‬‬
‫اﺿﺎﻓﺎت زﺑﺎن ﻋﺮﺑﯽ ﺑﺮای زﺑﺎن‬
‫ﻫﻮﺳﻪ و زﺑﺎن وﻟﻮف و دﯾﮕﺮ زﺑﺎﻧﻬﺎی‬
‫اﻓﺮﯾﻘﺎﯾﯽ و ﻧﻮﺷﺘﺎر زﺑﺎن ﻫﻨﺪﮐﻮ و‬
‫ﺷﺎﺑﮏ‬ ‫‪March‬‬
‫ﭘﺎﮐﺴﺘﺎن‪،‬‬ ‫در‬ ‫ﭘﻨﺠﺎﺑﯽ‬ ‫زﺑﺎن‬ ‫‪143,924‬‬ ‫‪154‬‬ ‫‪[۳۴]ISO/IEC 10646:2020‬‬ ‫‪13 0‬‬
‫‪۹۷۸-۱-۹۳۶۲۱۳-۲۶-۹‬‬ ‫‪2020‬‬
‫ﺑﻮﭘﻮﻣﻮﻓﻮ‪ ،‬و اﺿﺎﻓﺘﯽ ﺑﺮای ﮐﺎﻧﻮﺗﯽ‪،‬‬
‫ﻧﺸﺎﻧﻪ ﻫﺎی ﻣﺪرک ﺧﻼﻗﯿﺖ ﻋﻤﻮﻣﯽ‪،‬‬
‫ﮐﺎراﮐﺘﺮﻫﺎی ﮔﺮاﻓﯿﮑﯽ ﺑﺮای ﺗﻠﺘﮑﺴﺖ‬
‫و ﺳﯿﺴﺘﻢ ﻫﺎی راﯾﺎﻧﻪ ای دﻫﻪ ﻫﺎی‬
‫‪ 70‬و ‪ ،80‬و ﻫﻤﭽﻨﯿﻦ ‪55‬‬
‫اﯾﻤﻮﺟﯽ ]‪[۳۵‬‬

‫ﺗﻌﺪاد ﮐﺎراﮐﺘﺮﻫﺎﯾﯽ ﮐﻪ در ﻫﺮ ﻧﺴﺨﻪ از ﯾﻮﻧﯿﮑﺪ آورده ﺷﺪه ﺑﺮاﺑﺮ ﺑﺎ ﺟﻤﻊ ﮐﻞ ﮐﺎرﮐﺘﺮﻫﺎی ﻧﮕﺎرﺷﯽ‪ ،‬ﻗﺎﻟﺐ ﺑﻨﺪی‪ ،‬و ﮐﻨﺘﺮﻟﯽ اﺳﺖ )ﻣﺜﻼً ‪,‬‬

‫‪(excluding private-use characters, noncharacters and surrogate code points‬‬

‫ﯾﻮﻧﯿﮑﺪ در وﯾﻨﺪوز‬
‫در وﯾﻨﺪوز ای ﭘﯽآی ﺗﻮاﺑﻊ ﯾﻮﻧﯿﮑﺪ ﺑﺎ ﭘﺴﻮﻧﺪ ‪ W‬ﻣﯽآﯾﻨﺪ‪) .‬ﻣﺜﺎل‪ (CreateWindowExW :‬ﭘﺴﻮﻧﺪ ‪ W‬ﺣﺮف اول ﻋﺒﺎرت ‪wide character‬‬
‫اﺳﺖ ﮐﻪ در زﺑﺎنﻫﺎی ﺑﺮﻧﺎﻣﻪﻧﻮﯾﺴﯽ اﻧﻮاع دادهای ﮐﻪ ﯾﻮﻧﯿﮑﺪ را ﭘﺸﺘﯿﺒﺎﻧﯽ ﻣﯽﮐﻨﻨﺪ اﺳﺎﻣﯽ ﻣﺸﺎﺑﻬﯽ ﻣﺎﻧﻨﺪ ‪ WCHAR‬دارﻧﺪ و ﮔﺎﻫﯽ ﺑﻪ آن‬
‫ﻧﻮﯾﺴﻪ ﭼﻨﺪﺑﺎﯾﺘﯽ )ﺑﻪ اﻧﮕﻠﯿﺴﯽ‪ (multibyte character :‬ﻧﯿﺰ ﮔﻔﺘﻪ ﻣﯽﺷﻮد‪.‬‬
‫ٔ‬

‫ﺟﺴﺘﺎرﻫﺎی واﺑﺴﺘﻪ‬
‫وﯾﮑﯽ ﭘﺪﯾﺎ‪:‬ﺧﻂ ﻓﺎرﺳﯽ را ﭘﺎس ﺑﺪارﯾﻢ‬
‫وارد ﮐﺮدن ﯾﻮﻧﯿﮑﺪ‬
‫ﮐﺪﺑﻨﺪی ﻧﻮﯾﺴﻪ‬
‫ﻧﻮﯾﺴﻪ‬
‫ﻗﺎﻟﺐ ﯾﻮﻧﯽﮐﺪ‬

‫ﭘﯿﻮﻧﺪ ﺑﻪ ﺑﯿﺮون‬
(/https://jadi net/2015/10/mimic) ‫ﺷﻮﺧﯽ ﺑﺎ ﯾﻮﻧﯽﮐُﺪ‬

‫ﭘﺎﻧﻮﯾﺲ‬

"Unicode Transcriptions" (http://www unicode org/st 2010-03-16

andard/UnicodeTranscriptions html) The Unicode "Unicode Data-3 1 0" (https://www unicode org/Publ
Consortium 2011-11-11 Retrieved 2012-02-22 ic/3 1-Update/UnicodeData-3 1 0 txt) Retrieved
Unicode Standard (http://www unicode org/standard/s 2010-03-16
tandard html)
"Unicode Data-3 2 0" (https://www unicode org/Publ
"Unicode 6 1 Paperback Available" (https://www uni
ic/3 2-Update/UnicodeData-3 2 0 txt) Retrieved
code org/mail-arch/unicode-ml/y2012-m05/0240 ht
ml) announcements_at_unicode org Retrieved 2010-03-16

2012-05-30 "Unicode Data-4 0 0" (https://www unicode org/Publ

"Enumerated Versions of The Unicode Standard" (htt ic/4 0-Update/UnicodeData-4 0 0 txt) Retrieved
ps://www unicode org/versions/enumeratedversions h
2010-03-16
tml) Retrieved 2016-06-21
"Unicode Data-4 1 0" (https://www unicode org/Publ
"Unicode Data 1 0 0" (https://www unicode org/Publ
ic/4 1 0/ucd/UnicodeData txt) Retrieved
ic/reconstructed/1 0 0/UnicodeData txt) Retrieved
2010-03-16
2010-03-16
"Unicode Data 5 0 0" (https://www unicode org/Publ
"Unicode Data 1 0 1" (https://www unicode org/Publ
ic/5 0 0/ucd/UnicodeData txt) Retrieved
ic/reconstructed/1 0 1/UnicodeData txt) Retrieved
2010-03-17
2010-03-16
"Unicode Data 5 1 0" (https://www unicode org/Publ
"Unicode Data 1995" (https://www unicode org/Publ
ic/5 1 0/ucd/UnicodeData txt) Retrieved
ic/1 1-Update/UnicodeData-1 1 5 txt) Retrieved
2010-03-17
2010-03-16
"Unicode Data 5 2 0" (https://www unicode org/Publ
"Unicode Data-2 0 14" (https://www unicode org/Pu ic/5 2 0/ucd/UnicodeData txt) Retrieved

blic/2 0-Update/UnicodeData-2 0 14 txt) Retrieved 2010-03-17

2010-03-16 "Unicode Data 6 0 0" (https://www unicode org/Publ


ic/6 0 0/ucd/UnicodeData txt) Retrieved
"Unicode Data-2 1 2" (https://www unicode org/Publ
2010-10-11
ic/2 1-Update/UnicodeData-2 1 2 txt) Retrieved
"Unicode Data 6 1 0" (https://www unicode org/Publ
2010-03-16
ic/6 1 0/ucd/UnicodeData txt) Retrieved
"Unicode Data-3 0 0" (https://www unicode org/Publ 2012-01-31

ic/3 0-Update/UnicodeData-3 0 0 txt) Retrieved "Unicode Data 6 2 0" (https://www unicode org/Publ
ic/6 2 0/ucd/UnicodeData txt) Retrieved
2012-09-26 "The Unicode Standard, Version 11 0 0 Appendix
C" (https://www unicode org/versions/Unicode11 0
"Unicode Data 6 3 0" (https://www unicode org/Publ
0/appC pdf) (PDF) Unicode Consortium Retrieved
ic/6 3 0/ucd/UnicodeData txt) Retrieved
2018-06-11
2013-09-30
"Announcing The Unicode® Standard, Version
"Unicode Data 7 0 0" (https://www unicode org/Publ
ic/7 0 0/ucd/UnicodeData txt) Retrieved 11 0" (http://blog unicode org/2018/06/announcing-

2014-06-15 unicode-standard-version-110 html)

"Unicode 8 0 0" (https://www unicode org/versions/ blog unicode org Retrieved 2018-06-06
Unicode8 0 0/) Unicode Consortium Retrieved "The Unicode Standard, Version 12 0 0 Appendix
2015-06-17 C" (https://www unicode org/versions/Unicode12 0

"Unicode Data 8 0 0" (https://www unicode org/Publ 0/appC pdf) (PDF) Unicode Consortium Retrieved

ic/8 0 0/ucd/UnicodeData txt) Retrieved 2019-03-05

2015-06-17 "Announcing The Unicode® Standard, Version

"Unicode 9 0 0" (https://www unicode org/versions/ 12 0" (http://blog unicode org/2019/03/announcing-


Unicode9 0 0/) Unicode Consortium Retrieved unicode-standard-version-120 html)
2016-06-21
blog unicode org Retrieved 2019-03-05
"Unicode Data 9 0 0" (https://www unicode org/Publ
"Unicode Version 12 1 released in support of the
ic/9 0 0/ucd/UnicodeData txt) Retrieved
Reiwa Era" (http://blog unicode org/2019/05/unicod
2016-06-21
e-12-1-en html) blog unicode org Retrieved
Lobao, Martim (7 June 2016) "These Are The Two
2019-05-07
Emoji That Weren't Approved For Unicode 9 But
Which Google Added To Android Anyway" (https:// "The Unicode Standard, Version 13 0– Core
Specification Appendix C" (https://www unicode org/
www androidpolice com/2016/06/07/two-emoji-wer
versions/Unicode13 0 0/appC pdf) (PDF) Unicode
ent-approved-unicode-9-google-added-android-anyw
Consortium Retrieved 2020-03-11
ay/) Android Police Retrieved 4 September 2016
"Announcing The Unicode® Standard, Version
"Unicode 10 0 0" (https://www unicode org/version
s/Unicode10 0 0/) Unicode Consortium Retrieved 13 0" (http://blog unicode org/2020/03/announcing-

2017-06-20 unicode-standard-version-130 html)

blog unicode org Retrieved 2020-03-11

‫ﻣﻨﺎﺑﻊ‬
‫در وﯾﮑﯽاﻧﺒﺎر ﭘﺮوﻧﺪهﻫﺎﯾﯽ درﺑﺎر ٔه‬ http://www unicode org/standard/translations/persian h) ‫ﯾﻮﻧﯽﮐﺪ ﭼﯿﺴﺖ؟‬
.‫ﯾﻮﻧﯽﮐﺪ ﻣﻮﺟﻮد اﺳﺖ‬
۲۰۰۹ ‫ژوﺋﯿﻪ‬
ٔ ۱۰ ‫ﺗﺮﺟﻤﻪ روزﺑﻪ ﭘﻮرﻧﺎدر ﮐﻨﺴﺮﺳﯿﻮم ﯾﻮﻧﯽﮐﺪ درﯾﺎﻓﺖﺷﺪه در‬
ٔ (tml
‫ﻣﺸﺎرﮐﺖﮐﻨﻨﺪﮔﺎن وﯾﮑﯽ ﭘﺪﯾﺎ‪«Unicode (https://en wikipedia org/w/index php?title=Unicode&oldid=295745417)» .‬‬
‫داﻧﺸﻨﺎﻣﻪ وﯾﮑﯽﭘﺪﯾﺎی اﻧﮕﻠﯿﺴﯽ‪ ،‬ﺑﺎزﺑﯿﻨﯽﺷﺪه در ‪ ۱۱‬ژوﺋﻦ ‪۲۰۰۹‬‬
‫ٔ‬ ‫در‬

‫ﺑﺮﮔﺮﻓﺘﻪ از »‪&oldid=28833452‬ﯾﻮﻧﯽﮐﺪ=‪«https://fa wikipedia org/w/index php?title‬‬

‫اﯾﻦ ﺻﻔﺤﻪ آﺧﺮﯾﻦﺑﺎر در ‪ ۲۱‬آورﯾﻞ ‪ ۲۰۲۰‬ﺳﺎﻋﺖ ‪ ۱۲:۲۸‬وﯾﺮاﯾﺶ ﺷﺪهاﺳﺖ‪.‬‬

‫ﻫﻤﻪ ﻧﻮﺷﺘﻪﻫﺎ ﺗﺤﺖ ﻣﺠﻮز ‪ Creative Commons Attribution/Share-Alike‬در دﺳﺘﺮس اﺳﺖ؛ ﺑﺮای ﺟﺰﺋﯿﺎت ﺑﯿﺸﺘﺮ ﺷﺮاﯾﻂ اﺳﺘﻔﺎده را ﺑﺨﻮاﻧﯿﺪ‪.‬‬
‫ٔ‬
‫وﯾﮑﯽﭘﺪﯾﺎ® ﻋﻼﻣﺘﯽ ﺗﺠﺎری ﻣﺘﻌﻠﻖ ﺑﻪ ﺳﺎزﻣﺎن ﻏﯿﺮاﻧﺘﻔﺎﻋﯽ ﺑﻨﯿﺎد وﯾﮑﯽﻣﺪﯾﺎ اﺳﺖ‪.‬‬

You might also like