Download as pdf or txt
Download as pdf or txt
You are on page 1of 29

Các ӭng dөng Unicode trong web site tiӃng ViӋt 1

MӨC LӨC

Unicode cho chӳ ViӋt ......................................................................................................... 2


Bҧng ÿӕi chiӃu encoding các bӝ chӳ hiӋn hành vӟi Unicode ............................................. 4
Thӱ nghiӋm font Unicode chӭa glyphs chӳ ViӋt................................................................ 8
Chѭѫng trình hoán chuyӇn trang web ViӋt ngӳ thành tiêu chuҭn Unicode........................ 9
Dùng Frontpage 98/ 2000 viӃt webpage Unicode ViӋt ngӳ ............................................. 10
Cách Dùng Unicode ĈӇ Gõ TiӃng ViӋt Trong MS-WORD ............................................. 16
Cách chӑn Settings trong OutLook Express (IE 5) ÿӇ ÿӑc chӳ ViӋt
gӱi bҵng VoviMail hay NCR 18
Cách chӑn Settings trong OutLook 2000 ÿӇ ÿӑc chӳ ViӋt gӱi bҵng VoviMail hay NCR 22
Cách ÿánh chӳ ViӋt trong Hotmail ................................................................................... 26
Cách ÿánh chӳ ViӋt trong Yahoo! Mail............................................................................ 28
Các ӭng dөng Unicode trong web site tiӃng ViӋt 2

Unicode cho chӳ ViӋt

Unicode là mӝt cách dùng chӳ ViӋt theo tiêu chuҭn quӕc tӃ cho tin hӑc. Ðһc
ÿiӇm chính cӫa nó là ngѭӡi ta dùng 2 bytes (16 bits) cho mӛi mүu tӵ nhѭ ô,
ѫ, ă. Cho ÿӃn nay có nhiӅu bӝ chӳ ViӋt Nam nhѭ VISCII, VPS, VNI... vv…
ÿang ÿѭӑc dùng rҩt thӏnh hành trong nhiӅu áp dөng phҫn mӅm khác nhau.
VISCII là mӝt chuҭn cӫa nhóm khoa hӑc gia Tricholor. Trong chuҭn nҫy
mӛi mүu tӵ ÿѭӧc biӇu diӉn bҵng mӝt byte (8 bits). Nhóm Tricholor dùng
các con sӕ trӕng cӫa bӝ chӳ ASCII ( cӫa Mӻ - A là viӃt tҳt cho American,
trong khi VI cho Vietnamese) ÿӇ biӇu diӉn các chӳ ViӋt Nam có dҩu. Vì con
sӕ lӟn nhҩt có thӇ biӇu diӇn bҵng 1 byte là 255, ÿó chính là tәng sӕ mүu tӵ
ViӋt Nam tӕi ÿa ta có thӇ dùng ÿѭӧc bҩt cӭ lúc nào. Rҩt tiӃc chӳ ViӋt Nam
cҫn hѫn 255 mүu tӵ nên ngѭӡi ta phҧi ÿһt thêm bӝ chӳ Hoa (thí dө nhѭ
UHoàiH 1.1) hay thay thӃ các dҩu hiӋu ít dùng, nhѭ dҩu ngoһc kép, bҵng
nhӳng mүu tӵ ViӋt Nam cҫn phҧi có. Tӭc là hӉ muӕn có ÿҫy ÿӫ bӝ chӳ ViӋt
ta phҧi hy sinh vài dҩu hiӋu ít dùng cӫa bӝ chӳ ASCII.
Bӝ chӳ VPS cӫa Hӝi Vietnamese Professionals Society cNJng dùng cùng mӝt
nguyên tҳc nhѭ VISCII. Có ÿiӅu khác là vì VPS ÿѭӧc triӇn khai ӣ Pháp, nên
các khoa hӑc gia muӕn bҳt ÿҫu bҵng mӝt bӝ chӳ dùng cho tiӃng Pháp rӗi mӣ
mang thêm ÿӇ dùng cho chӳ ViӋt. Nói tóm lҥi, hai bӝ chӳ VISCII và VPS
khác nhau chӍ ӣ chӛ quy ѭӟc dùng con sӕ nào ÿӇ biӇu diӉn mӝt mүu tӵ ViӋt
Nam.
Ӣ ViӋt Nam có kiӇu chӳ .vnTimes rҩt thӏnh hành trên các trang Web. Các
khoa hӑc gia thiӃt kӃ kiӇu chӳ nҫy cNJng dùng mӝt nguyên tҳc giӕng nhѭ
trong VISCII và VPS. Nói mӝt cách khác, ta có thӇ dӏch (convert, map) tӯ
kiӇu chӳ nҫy qua kiӇu chӳ kia rҩt dӉ dàng vì có mӕi liên hӋ tӯng mүu tӵ mӝt
(one-to-one correspondence).
KiӇu chӳ VNI hѫi khác mӝt chút vì có nhiӅu chӛ ngѭӡi ta dùng 2 bytes ÿӇ
biӇu diӇn mӝt mүu tӵ. VNI là mӝt trong nhӳng bӝ chӳ ÿҫu tiên ÿѭӧc dùng
cho chӳ ViӋt trong tin hӑc. ÐiӅu ÿáng nói là sӵ thành công vӅ thѭѫng mҥi
cӫa VNI. Mһc dҫu muӕn ÿánh máy vӟi bӝ chӳ VNI ta phҧi trҧ tiӅn, công ty
VNI tích cӵc nhҩt trong viӋc triӇn khai các áp dөng phҫn mӅm cӫa VNI ÿӇ
phөc vө khách hàng. Trong khi ÿó các tә chӭc Tricholor và Vietnamese
Professionals Society là gӗm nhӳng khoa hӑc gia thiӋn nguyӋn, tҩt cҧ ÿӅu có
viӋc làm toàn thӡi gian nên công viӋc triӇn khai phҫn mӅm cho các bӝ chӳ
phҧi bӏ giӟi hҥn.
Các ӭng dөng Unicode trong web site tiӃng ViӋt 3

Còn VietNet chҷng qua chӍ là mӝt quy ѭӟc vӅ cách dùng các mүu tӵ có sҹn
cӫa ASCII ÿӇ ÿánh tiӃng ViӋt. Nhӳng dҩu dùng cho các nguyên âm ÿѭӧc
ÿánh thêm, thí dө nhѭ chӳ "Ðѭa ÿón" ÿѭӧc ÿánh là "DDu+a ddón". Do ÿó,
nói cho ÿúng ra VietNet không phҧi là mӝt bӝ chӳ.
Các ӭng dөng Unicode trong web site tiӃng ViӋt 4

Bҧng ÿӕi chiӃu encoding các bӝ chӳ hiӋn hành vӟi


Unicode

VPS VISCII VNI TCVN Unicode Unicode


VIQR VPS VISCII VNI TCVN UTF-8 Hex
Hex Hex Hex Hex Symbol Hex Dec

61 00E1
a' á E1 á E1 aù ¸ B8 á C3 A1
F9 225

61 00E0
a` à E0 à E0 aø µ B5 à C3 A0
F8 224

61 1EA3
a? ä E4 ä E4 aû ¶ B6 ҧ E1 BA A3
FB 7843

61 00E3
a~ ã E3 ã E3 aõ · B7 ã C3 A3
F5 227

61 1EA1
a. å E5 Õ D5 aï ¹ B9 ҥ E1 BA A1
EF 7841

61 0103
a( æ E6 å E5 aê ¨ A8 ă C4 83
EA 259

61 1EAF
a(' ¡ A1 ¡ A1 aé ¾ BE ҳ E1 BA AF
E9 7855

61 1EB1
a(` ¢ A2 ¢ A2 aè » BB ҵ E1 BA B1
E8 7857

61 1EB3
a(? £ A3 Æ C6 aú ¼ BC ҷ E1 BA B3
FA 7859

61 1EB5
a(~ ¤ A4 Ç C7 aü ½ BD ҹ E1 BA B5
FC 7861

61 1EB7
a(. ¥ A5 £ A3 aë Æ C6 һ E1 BA B7
EB 7863

61 00E2
a^ â E2 â E2 aâ © A9 â C3 A2
E2 226

a^' Ã C3 ¤ A4 aá 61 Ê CA ҩ 1EA5 E1 BA A5
Các ӭng dөng Unicode trong web site tiӃng ViӋt 5

E1 7845

61 1EA7
a^` À C0 ¥ A5 aà Ç C7 ҫ E1 BA A7
E0 7847

61 1EA9
a^? Ä C4 ¦ A6 aå È C8 ҭ E1 BA A9
E5 7849

61 1EAB
a^~ Å C5 ç E7 aã É C9 ү E1 BA AB
E3 7851

61 1EAD
a^. Æ C6 § A7 aä Ë CB ұ E1 BA AD
E4 7853

65 00E9
e' é E9 é E9 eù Ð D0 é C3 A9
F9 233

65 00E8
e` è E8 è E8 eø Ì CC è C3 A8
F8 232

65 1EBB
e? È C8 ë EB eû Î CE ҿ E1 BA BB
FB 7867

65 1EBD
e~ ë EB ¨ A8 eõ Ï CF Ӂ E1 BA BD
F5 7869

65 1EB9
e. Ë CB © A9 eï Ñ D1 ҽ E1 BA B9
EF 7865

65 00EA
e^ ê EA ê EA eâ ª AA ê C3 AA
E2 234

65 1EBF
e^' ‰ 89 ª AA eá Õ D5 Ӄ E1 BA BF
E1 7871

65 1EC1
e^` Š 8A « AB eà Ò D2 Ӆ E1 BB 81
E0 7873

65 1EC3
e^? ‹ 8B ¬ AC eå Ó D3 Ӈ E1 BB 83
E5 7875

65 1EC5
e^~ Í CD AD eã Ô D4 Ӊ E1 BB 85
E3 7877

65 1EC7
e^. Œ 8C ® AE eä Ö D6 Ӌ E1 BB 87
E4 7879

i' í ED í ED í ED Ý DD í 00ED C3 AD
Các ӭng dөng Unicode trong web site tiӃng ViӋt 6

237

00EC
i` ì EC ì EC ì EC × D7 ì C3 AC
236

1EC9
i? Ì CC ï EF æ E6 Ø D8 Ӎ E1 BB 89
7881

0129
i~ ï EF î EE ó F3 Ü DC ƭ C4 A9
297

1ECB
i. Î CE ¸ B8 ò F2 Þ DE ӏ E1 BB 8B
7883

6F 00F3
o' ó F3 ó F3 où ã E3 ó C3 B3
F9 243

6F 00F2
o` ò F2 ò F2 oø ß DF ò C3 B2
F8 242

6F 1ECF
o? Õ D5 ö F6 oû á E1 ӓ E1 BB 8F
FB 7887

6F 00F5
o~ õ F5 õ F5 oõ â E2 õ C3 B5
F5 245

6F 1ECD
o. † 86 ÷ F7 oï ä E4 ӑ E1 BB 8D
EF 7885

6F 00F4
o^ ô F4 ô F4 oâ « AB ô C3 B4
E2 244

6F 1ED1
o^' Ó D3 ¯ AF oá è E8 ӕ E1 BB 91
E1 7889

6F 1ED3
o^` Ò D2 ° B0 oà å E5 ӗ E1 BB 93
E0 7891

6F 1ED5
o^? ° B0 ± B1 oå æ E6 ә E1 BB 95
E5 7893

6F 1ED7
o^~ ‡ 87 ² B2 oã ç E7 ӛ E1 BB 97
E3 7895

6F 1ED9
o^. ¶ B6 µ B5 oä é E9 ӝ E1 BB 99
E4 7897

o+ Ö D6 ½ BD ô F4 ¬ AC ѫ 01A1 C6 A1
Các ӭng dөng Unicode trong web site tiӃng ViӋt 7

417

F4 1EDB
o+' § A7 ¾ BE ôù í ED ӟ E1 BB 9B
F9 7899

F4 1EDD
o+` © A9 ¶ B6 ôø ê EA ӡ E1 BB 9D
F8 7901

F4 1EDF
o+? ª AA · B7 ôû ë EB ӣ E1 BB 9F
FB 7903

F4 1EE1
o+~ « AB Þ DE ôõ ì EC ӥ E1 BB A1
F5 7905

F4 1EE3
o+. ® AE þ FE ôï î EE ӧ E1 BB A3
EF 7907

u'</Fon
Các ӭng dөng Unicode trong web site tiӃng ViӋt 8

Thӱ nghiӋm font Unicode chӭa glyphs chӳ ViӋt

Font- Tahoma
Font chӳ trong khung này thay
Family: ÿәi theo thӇ Font trong combo
box bên trái Ðây là font chӳ
Font- 5
trong mӝt phҫn cӫa mӝt câu.
Size:
NӃu font chӳ nào không có
Font- glyphs mүu tӵ chӳ ViӋt thì bҥn sӁ
Normal
Weight: không ÿӑc ÿѭѫc chӳ ViӋt mà chӍ
thҩy ô vuông.
Khi bҥn thay ÿәi font trong Bҥn có thӇ dùng phѭѫng tiӋn này
combo box: Font-Family, ÿӇ set Default font ѭa chuӝng
Font-Size hay Font-Weight, cho browser ÿang dùng cӫa bҥn.
văn bҧn trong khung bên phҧi
cNJng sӁ thay ÿәi và dùng theo
font bҥn chӑn. Bҥn sӁ không
ÿӑc ÿѭӧc chӳ ViӋt nӃu font
bҥn chӑn không chӭa mүu tӵ
glyphs Unicode tiӃng ViӋt.

Trang web này giúp bҥn lӵa


ra nhӳng font Unicode trong
máy cӫa bҥn, font nào có thӇ
sӱ dөng ÿӇ trình bày Unicode
chӳ ViӋt và font nào không
thӇ dùng ÿӇ trình bày
Unicode chӳ ViӋt.
Các ӭng dөng Unicode trong web site tiӃng ViӋt 9

Chѭѫng trình hoán chuyӇn trang web ViӋt ngӳ


thành tiêu chuҭn Unicode

NӃu bҥn ÿã có mӝt mҥng ÿiӇm ÿѭӧc viӃt bҵng mӝt trong các mã tiêu chuҭn
ViӋt ngӳ sau ÿây: Viscii, VPS, VNI và .vnTime và bҥn muӕn biӃn toàn bӝ
mҥng ÿiӇm cӫa bҥn thành tiêu chuҭn Unicode thì ÿây ÿúng là chѭѫng trình
bҥn cҫn dùng.
Chѭѫng trình VNtoUnicode có thӇ chuyӇn các trang web ViӋt ngӳ trong mӝt
folder hay directory thành trang web ViӋt ngӳ Unicode. Các mã tiêu chuҭn
ViӋt ngӳ ÿѭӧc hӛ trӧ gӗm Viscii, VPS, VNI và .vnTime nhѭng bҥn có thӇ
nӟi rӝng hӛ trӧ cho các tiêu chuҭn khác bҵng cách thêm chúng vào mã lұp
trình. Chѭѫng trình này ÿѭӧc viӃt bҵng Microsoft Visual Basic 6.0, do tiӃn
sƭ Lê Ðӭc Hӗng thӵc hiӋn và tҩt cҧ các mã lұp trình và bҧng mүu chuyӉn mã
ÿӅu ÿѭӧc gói trong hӗ sѫ vntounicode.zip ÿӇ bҥn download.
Mӛi tiêu chuҭn ÿӅu có mӝt bҧng mã hoán chuyӇn (mapping table) nhѭ
VNItoUnicode.txt, VISCIItoUnicode.txt, VPStoUnicode and
VNTimetoUnicode. Bҥn có thӇ thêm bҧng mã ÿӕi chiӃu khác cho mã tiêu
chuҭn ViӋt ngӳ khác. Chѭѫng trình này chӫ yӃu làm 3 viӋc nhѭ sau:

x ChuyӇn tҩt cҧ các cһp tӵ nhѭ "aù" thành Unicode tѭѫng ӭng.
x ChuyӇn tҩt cҧ tên Font thành "Tahoma".
x ChuyӇn mүu tӵ ViӋt thành mã sӕ Unicode.

Trong hӗ sѫ zip có chӭa các trang web mүu bҵng VPS, VNI, VISCII và
.vnTime vӟi các trang web Unicode mã sӕ và UTF-8 tѭѫng ӭng. Mӝt khi
bҥn ÿã có trang bҵng mã sӕ Unicode, thì bҥn có thӇ tiӃn thêm mӝt bѭӟc
chuyӇn trang Unicode mã sӕ thành trang web UTF-8. Vì chѭѫng trình này
làm viӋc theo tӯng nhóm trang web ÿѭӧc ÿһt trong mӝt folder nên tӕc ÿӝ
hoán chuyӇn sӁ tăng lên rҩt nhiӅu.
Bҥn có thӇ sӱa ÿәi mã lұp trình cӫa chѭѫng trình này ÿӇ sӱ dөng nhӳng Font
khác nhѭ Arial, Courier New, Times New Romans, Verdana... vân vân. Bҥn
cNJng có thӇ sӱa ÿәi mã lұp trình này ÿӇ tӵ ÿӝng hóa chѭѫng trình hoán
chuyӇn theo nhu cҫu cӫa bҥn. NӃu bҥn biӃn cҧi mã lұp trình này, chúng tôi
kǤ vӑng bҥn sӁ thông báo cho chúng tôi biӃt và gӱi cho chúng tôi mӝt bҧn
biӃn cҧi cӫa bҥn ÿӇ nhӳng sӵ thay ÿәi hӳu dөng khác có thӇ ÿѭӧc ÿѭa vào
trong các bҧn chѭѫng trình tѭѫng lai.
Các ӭng dөng Unicode trong web site tiӃng ViӋt 10

Dùng Frontpage 98/ 2000


viӃt webpage Unicode ViӋt ngӳ

NӃu bҥn ÿang dùng Windows 2000 Professional/ Server thì bҥn có thӇ gõ
chӳ ViӋt Unicode (dùng các chѭѫng trình gõ chӳ ViӋt nhѭ VPS, VietKey,
VNI vv...) trong Notepad hay WordPad 2000 ÿӇ viӃt webpage chӳ ViӋt trӵc
tiӃp bҵng HTML.
Nhѭng nӃu bҥn ÿang dùng Windows 95.x hay Windows 98.x thì Fronpage là
công cө không thӇ thiӃu ÿѭӧc ÿӇ giúp bҥn viӃt webpage Unicode ViӋt ngӳ
mӝt cách dӉ dàng tiӋn lӧi. HiӋn nay (tháng Tѭ 2001) trên thӏ trѭӡng Web
Editors thì Frontpage 98/ 2000 là mӝt trong vài wysiwyg editors hӛ trӧ
Unicode.
Các web editors khác nhѭ Cold Fusion 4.x, Dreamweaver 4, Dreamweaver
UltraDev 4, NetOject Fusion 5 vân vân ÿӅu không hӛ trӧ Unicode. Dƭ nhiên
chúng ta vүn có thӇ dùng nhӳng web editors trên ÿӇ viӃt webpage ViӋt Ngӳ
nhѭng bҩt tiӋn ӣ chӛ là không ÿӑc ÿѭӧc tiӃng ViӋt và không thҩy ÿѭӧc lӛi
chính tҧ ÿӇ sӳa lӛi câu văn...
Bҥn có thӇ dùng các chѭѫng trình gõ chӳ ViӋt mӟi nhҩt cӫa VPS, VietKey,
VNI vân vân ÿӇ gõ chӳ ViӋt Unicode. Các chѭѫng trình trên có thӇ dùng
trong hҫu hӃt các ӭng dөng cӫa bӝ Office 97, Office 2000 và mӝt sӕ ӭng
dөng khác.
Trѭӟc kia Frontpage 97 và Frontpage 98 là chѭѫng trình ÿӝc lұp cӫa
Microsoft, nhѭng kӇ tӯ Frontpage 2000, Micorsoft ÿã nhұp nó vào thành
viên cӫa bӝ Office 2000. Tҩt cҧ các bӝ Frontpage nói trên ÿӅu hӛ trӧ
Unicode nhѭng dƭ nhiên là bӝ Frontpage 2000 là có hӛ trӧ Unicode ÿҫy ÿӫ
nhҩt.
Trong phҫn này chúng tôi chӍ bàn ÿӃn phҫn dùng Unicode cӫa Frontpage
2000 trong webpage ViӋt ngӳ và các bҥn có thӇ suy diӉn tӯ bӝ này cho bӝ
Frontpage 98.
Trong Frontpage 2000 bҥn có thӇ mӣ mӝt trang mӟi bҵng cách vào: File >
New > Page
Sau khi mӝt trang mӟi ÿã ÿѭӧc mӣ ra sҹn sàng cho bҥn ÿѭa dӳ liӋu và hình
ҧnh trang trí vào thì trong phҫn góc dѭӟi bên trái cӫa Window chánh View/
Các ӭng dөng Unicode trong web site tiӃng ViӋt 11

Page bҥn sӁ thҩy có 3 tab chӑn lӵa sau ÿây: Normal, HTML, Preview. Tóm
tҳc cách dùng cӫa 3 tabs này nhѭ sau:
Normal: cho phép bҥn nhìn wysiwyg cӫa trang web bҥn ÿang làm viӋc và
cho bҥn sӱa chӳa tùy ý trang web này.
HTML: bҥn ÿӑc thҩy toàn bӝ tag nӝi HTML cӫa trang và có thӇ sӱa chӳa
trang web bҵng HTML tag nhѭ bҥn làm viӋc trên trang web khi mӣ bҵng
NotePad.
Preview: bҥn chӍ nhìn thҩy wysiwyg cӫa trang web nhѭng không sӱa ÿѭӧc.
Sau khi gõ vào tab Normal ÿӇ có thӇ biên soҥn trang web, bҥn nhҩp chuӝt
phҧi trong bҩt kǤ chӛ nào trong trang web ÿӇ cho ra popup menu rӗi chӑn
Page Properties..., mӝt window nhѭ sau hiӋn lên:

Tҩt cҧ các setting ÿӇ sӱ dөng Unicode cho mӑi trang web ÿӅu nҵm trong tab
Language nên bҥn gõ vào Language tab ÿӇ thҩy window sau:
Các ӭng dөng Unicode trong web site tiӃng ViӋt 12

Tùy theo cách setting cӫa bҥn ÿһt trong Tools/ Web Setting, Page Properties/
Language sӁ hiӋn lên khác nhau. Hình trên là cách setting cӫa các trang
trong Vovisoft ÿӇ sӱ dөng Unicode NCR và phҫn setting trên sӁ tӵ ÿӝng viӃt
cho bҥn hàng meta tag sau (meta tag có chӳ ÿұm) trong phҫn Heading tag
cӫa trang:

<head>
<meta http-equiv="Content-Type" content="text/html;
charset=windows-1252">
<meta name="GENERATOR" content="Microsoft FrontPage 4.0">
<meta name="ProgId" content="FrontPage.Editor.Document">
<title>Using Unicode in Frontpage 2000</title>
</head>

NӃu bҥn chӑn Vietnamese trong combo box (Mark current document as:)
nhѭ hình sau:

thì bҥn sӁ có thêm hàng meta tag nhѭ sau:

<meta http-equiv="Content-Language" content="vi">


Các ӭng dөng Unicode trong web site tiӃng ViӋt 13

Chӳ "vi" trong content="vi" là ký hiӋu tҳt (short string) cӫa locale ID Vietnam.
NӃu bҥn muӕn tìm hiӇu thêm vӅ các ký hiӋu tҳt locale ID dùng cho ngôn
ngӳ các quӕc gia thì gõ vào ÿây. Meta tag này dùng xác ÿӏnh ngôn ngӳ ÿѭӧc
dùng trong trang web ÿӇ Frontpage ӭng dөng ÿúng phҫn mӅm kiӇm tra ÿánh
vҫn và giúp các Search Engine xác ÿӏnh ngôn ngӳ ÿѭӧc dùng trong trang
web mà nó ÿang lөc tìm.
Hàng meta tag vӅ locale theo bút giҧ là không cҫn thiӃt cho các trang sӱ
dөng Unicode cho tiӃng ViӋt nhѭ các trang web trong Vovisoft. Tuy nhiên
nӃu dùng locale Vietnam (Vietnamese Windows) theo Microsoft và dùng
codepage 1258 cho tiӃng ViӋt thì meta tag này sӁ giúp cho nhӳng ai ÿã set
trong browser sӱ dөng Vietnamese 1258 có thӇ chҥy thҷng vào các trang
dùng Vietnamese 1258 cӫa mҥng có ÿa ngôn ngӳ mà tiӃng ViӋt là mӝt trong
các ngôn ngӳ ÿѭӧc ӭng dөng. ÐiӅu ÿáng chú ý là code page 1258 không
phҧi là mã Unicode vì có mӝt sӕ mã ÿiӇm (code points) không xӃp theo tӵ vӏ
trong giҧi sӕ Unicode.
Nói tóm lҥi bҥn set Language Tab trong Page Properties cӫa Frontpage 2000
nhѭ sau nӃu dùng Unicode NCR:
Page Language
Mark current document as: <none>
HTML encoding
Save the document as: US/Western European (codepage 1252)
Reload the current document as: <Automatic Encoding>
và set Language Tab trong Page Properties cӫa Frontpage 2000 nhѭ sau nӃu
dùng Unicode UTF-8:
Page Language
Mark current document as: <none>
HTML encoding
Save the document as: Multilingual (UTF-8)
Reload the current document as: <Automatic Encoding>
Bҥn sӁ thҩy trong phҫn Header tag cӫa trang có phҫn meta tag sau:
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
Mӝt ÿiӅu ÿӝc ÿáo cӫa Frontpage 2000 là bҥn có thӇ chuyӇn ÿәi tӯ NCR
thành UTF-8 hay ngѭӧc lҥi mӝt cách dӉ dàng bҵng cách set charset=1252 thành
charset=utf-8 hay ngѭӧc lҥi rӗi "Save" trang web là bҥn có ngay mã Unicode
NCR hay UTF-8. Có lҿ cho ÿӃn giӡ cNJng chѭa có chѭѫng trình Web Editor
nào xӱ lý Unicode nhuyӉn nhѭ Frontpage 2000.
Các ӭng dөng Unicode trong web site tiӃng ViӋt 14

NCR là mӝt phѭѫng pháp biӇu hiӋn Unicode bҵng tӵ vӏ trong giҧi sӕ ký tӵ
Unicode 16 bit còn UTF-8 là mӝt cách mã cӕt bҵng 8 bit cӫa Unicode. NӃu
bҥn chѭa rõ thӃ nào là Unicode NCR và thӃ nào là UTF-8 thì mӡi bҥn gõ vào
ÿây.

NӃu bҥn chӍ dùng Frontpage 2000 ÿӇ viӃt website ViӋt ngӳ bҵng Unicode
thôi thì bҥn có thӇ set luôn cho trang mӟi default cӫa Frontpage 2000 có
charset là 1252 hoһc UTF-8. Bҥn vào Tools/ Web settings... và trong hӝp
Window hiӋn lên, bҥn chӑn tab Language rӗi trong:
Server message language: chӑn English
Default page encoding: chӑn US/Western European

Rӗi nhҩn vào nút OK. Tӯ giӡ trӣ ÿi cӭ mӛi lҫn bҥn mӣ mӝt trang Frontpage
mӟi ÿӇ viӃt bài thì trang mӟi ÿó ÿã có sҹn hàng meta tag sau:
<meta http-equiv="Content-Type" content="text/html; charset=windows-
1252">
ÿӇ bҥn gõ Unicode chӳ ViӋt theo Decimal NCR.
NӃu bҥn muӕn dùng UTF-8 thì trong:
Default page encoding: chӑn Multilingual (UTF-8)
và khi mӣ mӝt trang mӟi bҥn sӁ có sҹn meta tag sau:
Các ӭng dөng Unicode trong web site tiӃng ViӋt 15

<meta http-equiv="Content-Type" content="text/html; charset=utf-8">


Sau khi set sҹn các phҫn trên, bҥn chӍ còn mӝt ÿiӇm nên lѭu ý ÿó là luôn áp
dөng font: Tahoma, Arial, Times New Roman vv... vào tҩt cҧ text ViӋt ngӳ
vì nӃu không sӁ có browser (ÿã set sҹn nhӳng fonts default không chӭa
glyphs chӳ ViӋt) không ÿӑc ÿѭӧc Unicode ViӋt ngӳ cӫa bҥn.
Ghi chú:
Các bҧn Internet Explorer 4.x trӣ vӅ sau ÿӅu có thӇ trình bày ÿúng Unicode
theo NCR hay UTF-8 khi ÿһt ÿúng charset theo dҥng cӫa nó nhѭng Netscape
4.x thì chӍ có thӇ hiӇn thӏ Unicode ÿúng nӃu trang web ÿѭӧc mã theo UTF-8.
NӃu bҥn muӕn cҧ hai browsers trên ÿӅu có thӇ hiӇn thӏ ÿѭӧc trang web ViӋt
ngӳ cӫa bҥn thì bҥn nên dùng UTF-8 cho các trang web ViӋt ngӳ.
Mӝt ÿiӇm lҥ nӳa là theo mӝt sӕ báo cáo và theo kinh nghiӋm cӫa bút giҧ thì
Netscape 4.x có thӇ hiӇn thӏ ÿѭӧc Unicode mã theo NCR vӟi ÿiӅu kiӋn là
meta tag phҧi set theo:
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
Nhѭ vұy có nghƭa là Netscape 4.x ÿã xem UTF-8 nhѭ mӝt code page (giӕng nhѭ các codepages: 1251,
1252...1258 vân vân...) chӭ không phҧi là mӝt dҥng mã Unicode 8 bit nhѭng qua Netscape 6.x thì ÿiӅu này ÿã
ÿѭӧc chӍnh lҥi.
Các ӭng dөng Unicode trong web site tiӃng ViӋt 16

Cách Dùng Unicode ĈӇ Gõ TiӃng ViӋt


Trong MS-WORD

ThiӃt KӃ MS-WORD Template:

1. Vào Tools \ Options \ File Location tab ÿӇ xem biӃt directory cӫa
Startup files.
2. Ra khӓi MS-WORD và copy vnunicode.dot vào directory cӫa startup
files. Thѭӡng thѭӡng directory này là C:\Windows\Application
Data\Microsoft\Word\Startup\
3. Mӣ MS-WORD trӣ lҥi và vào Tools \ Templates and Add-Ins và
check [check box] cӫa vnunicode.dot nӃu cҫn.
4. HiӋn giӡ nên dùng font Tahoma cho bҧo ÿҧm. Bҥn có thӇ vào Format
\ Styles ÿӇ set Tahoma làm default font. Trong tѭѫng lai có thӇ dùng
các fonts khác nhѭ Arial, Times New Roman, v…v…
5. NӃu muӕn thì vào Tools \ Auto Correct và uncheck hӃt tҩt cҧ các
check boxes ÿӇ MS-Word khӓi tӵ ÿӝng ÿәi nhӳng chӳ nhѭ i thành I
(ÿây là mӝt feature có thӇ rҩt phiӅn phӭc hѫn là ích lӧi).

Cách Ĉánh Dҩu:


Dùng các nút bҩm sau ÿây ÿӇ ÿánh dҩu trѭӟc khi bҩm nút nguyên âm.
Nút Bҩm Trѭӟc Khi Bҩm
Dҩu Thí Dө
Nút Nguyên Âm

á : Ctrl + 1, A
Sҳc Ctrl + 1
Á : Ctrl + 1, Shift + A

à : Ctrl + 2 , A
HuyӅn Ctrl + 2
À : Ctrl + 2 , Shift+A

ҧ : Ctrl + 3 , A
Hӓi Ctrl + 3
Ҧ : Ctrl + 3 , Shift+A

ã : Ctrl + 4 , A
Ngã Ctrl + 4
à : Ctrl + 4 , Shift+A

ҥ : Ctrl + 5 , A
Nһng Ctrl + 5
Ҥ : Ctrl + 5 , Shift+A

â : Ctrl + 6 , A
Âêô Ctrl + 6
 : Ctrl + 6 , Shift+A
Các ӭng dөng Unicode trong web site tiӃng ViӋt 17

ă : Ctrl + 7 , A
Ă Ctrl + 7
Ă : Ctrl + 7, Shift+A

ѭ : Ctrl + 8 , A
Ѭѭ Ctrl + 8
Ѭ : Ctrl + 8 , Shift+U

ÿ : Ctrl + 9 , D
Ð Ctrl + 9
Ð : Ctrl + 9 , Shift+D

ҩ : Alt + 1 , A
ҩӃӕ Atl + 1
Ҩ : Alt + 1 , shift+A

ҫ : Alt + 2 , A
ҫӅӗ Atl + 2
Ҫ : Alt + 2 , shift+A

ҭ : Alt + 3 , A
ҭӇә Alt + 3
Ҭ : Alt + 3 , Shift+A

ү : Alt + 4 , A
үӉӛ Alt + 4
Ү : Alt + 4 , Shift+A

ұ : Alt + 5 , A
ұӋӝ Alt + 5
Ұ : Alt + 5 , Shift+A

ҳ : Ctrl+Alt + 1 , A
ҳӟӭ Ctrl + Alt + 1
Ҳ : Ctrl+Alt + 1 , Shift+A

ҵ : Ctrl+Alt + 2 , A
ҵӡӯ Ctrl + Alt + 2
Ҷ : Ctrl+Alt + 2 , Shift+A

ҷ : Ctrl+Alt + 3 , A
ҷӣӱ Ctrl + Alt + 3
Ҷ : Ctrl+Alt + 3 , Shift+A

ҹ : Ctrl+Alt + 4 , A
ҹӥӳ Ctrl + Alt + 4
Ҹ : Ctrl+Alt + 4 ,Shift+A

һ : Ctrl+Alt + 5 , A
һӧӵ Ctrl + Alt + 5
Һ : Ctrl+Alt + 5 , Shift+A

Nói tóm lҥi:

1. ÿánh dҩu trѭӟc, nguyên âm sau.


2. dùng Ctrl cho dҩu ÿѫn, Alt cho ô hay â vӟi dҩu và Ctrl + Alt cho ѭ
hay ѫ vӟi dҩu
Các ӭng dөng Unicode trong web site tiӃng ViӋt 18

Cách chӑn Settings trong OutLook Express (IE 5)


ÿӇ ÿӑc chӳ ViӋt gӱi bҵng VoviMail hay NCR

Các bҥn sӱ dөng OutLook Express cӫa IE 5x ÿӇ nhұn email có thӇ chӑn các
settings cӫa OutLook Express nhѭ sau ÿӇ có thӇ ÿӑc ÿѭӧc chӳ ViӋt Unicode:
Trên Menu cӫa OutLook Express gõ vào Tools - Options - Read ÿӇ mӣ tab
box sau ÿây:

Hình 1

Gõ vào nút Fonts... trong phҫn Fonts cӫa (hình 1) ÿӇ mӣ dialogue sau ÿây:
Các ӭng dөng Unicode trong web site tiӃng ViӋt 19

Hình 2

Trong phҫn [Font settings] chӑn Western European nhѭ hình trên

Trong phҫn Proportional font chӑn Tahoma nhѭ hình trên

Trong phҫn Encoding chӑn Western European (windows) nhѭ hình trên

Gõ vào nút [Set as Default] rӗi gõ vào nút OK ÿӇ ÿóng dialogue trên lҥi

Gõ vào nút International settings trong (hình 1)... ÿӇ mӣ dialogue sau ÿây:

Hình 3

Dialogue trên cho thҩy Western European (Windows) là Default encoding


cӫa OutLook Express
Các ӭng dөng Unicode trong web site tiӃng ViӋt 20

NӃu muӕn dùng OutLook Express ÿӇ gӱi email chӳ ViӋt thì có thӇ set nhѭ
sau:
Trong phҫn tab Send cӫa dialogue sau ÿây, gõ vào nút International
Settings...

Hình 4

Trong phҫn Default encoding cӫa dialogue sau ÿây chӑn Western European
(Windows)

Hình 5
Các ӭng dөng Unicode trong web site tiӃng ViӋt 21

Gõ vào nút OK ÿӇ ÿóng dialogue trên lҥi


Trong hình 4 trên gõ vào nút HTML ÿӇ mӣ dialogue sau ÿây:

Hình 6

Trong phҫn [Encode text using] chӑn None rӗi gõ nút OK ÿӇ ÿóng dialogue
lҥi
Các phҫn khác giӳ nguyên nhѭ default cӫa nó.
Bҥn có thӇ dùng chѭѫng trình ÿánh chӳ ViӋt nhѭ Vps 4.0 ÿӇ ÿánh chӳ ViӋt
trong Outlook Express. Bҥn vô phҫn tab Kӻ Thuұt - Bҧng Mã - Bҧng Sӱa
Mã cӫa Vps và chӑn :Unicode ÿӇ chӍ thӏ cho Vps dùng mã chӳ Unicode khi
ÿánh chӳ ViӋt. Tuy nhiên nӃu bҥn không muӕn nhӭc ÿҫu vӅ các setting khi
gӱi ÿiӋn thѭ thì bҥn có thӇ dùng ngay VoviMail ÿӇ ÿánh chӳ ViӋt mà không cҫn
chҥy mӝt chѭѫng trình bên ngoài.
Các ӭng dөng Unicode trong web site tiӃng ViӋt 22

Cách chӑn Settings trong OutLook 2000


ÿӇ ÿӑc chӳ ViӋt gӱi bҵng VoviMail hay NCR

Các bҥn sӱ dөng OutLook 2000 ÿӇ nhұn email có thӇ chӑn các settings cӫa
OutLook nhѭ sau ÿӇ có thӇ ÿӑc ÿѭӧc chӳ ViӋt Unicode:
Trên Menu cӫa OutLook gõ vào Tools - Options - Mail Format ÿӇ mӣ tab
box sau ÿây:

Hình 1

Trong [Send in this message format] cӫa (hình 1) chӑn HTML nhѭ hình
trên
Gõ vào nút Settings... ÿӇ mӣ dialogue sau ÿây:
Các ӭng dөng Unicode trong web site tiӃng ViӋt 23

Hình 2

Trong phҫn [Encode text using] cӫa (hình 2) chӑn None nhѭ hình trên rӗi gõ
nút OK
Gõ vào nút International Options... cӫa (hình 1) ÿӇ mӣ dialogue sau ÿây:

Hình 3

Chӑn Western European (Windows) cho cҧ hai combo box nhѭ hình trên
Trong phҫn Stationery and Fonts trong (hình 1), gõ vào nút Fonts... ÿӇ mӣ
dialogue sau ÿây:
Các ӭng dөng Unicode trong web site tiӃng ViӋt 24

Hình 4

Trong phҫn Message Fonts cӫa dialogue trên chӑn font Tahoma cho cҧ hai
phҫn:
When composing a new message (NӃu bҥn muӕn chuyӇn Email bҵng chӳ
ViӋt)
when replying and forwarding (NӃu bҥn muӕn chuyӇn Email bҵng chӳ ViӋt)
Gõ vào nút Fonts cӫa phҫn Stationery and Fonts trong (hình 1) ÿӇ mӣ ra
dialogue sau ÿây:
Các ӭng dөng Unicode trong web site tiӃng ViӋt 25

Hình 5

Trong phҫn Font settings chӑn Western European nhѭ hình 5


Trong phҫn Proportional font chӑn Tahoma nhѭ hình 5
Các phҫn còn lҥi cӭ giӳ nguyên nhѭ default cӫa OutLook
Cách chӑn setting nhѭ trên sӁ cho phép bҥn ÿӑc ÿѭӧc chӳ ViӋt Unicode
ÿӗng thӡi ÿiӋn thѭ gӳi trҧ lӡi cNJng sӁ chuyӇn chӳ ViӋt ÿúng cho ngѭӡi nhұn.
Bҥn có thӇ dùng chѭѫng trình ÿánh chӳ ViӋt nhѭ Vps 4.0 ÿӇ ÿánh chӳ ViӋt
trong Outlook 2000. Bҥn vô phҫn tab Kӻ Thuұt - Bҧng Mã - Bҧng Sӱa Mã
cӫa Vps và chӑn :Unicode ÿӇ chӍ thӏ cho Vps dùng mã chӳ Unicode khi
ÿánh chӳ ViӋt. Tuy nhiên nӃu bҥn không muӕn nhӭc ÿҫu vӅ các setting khi
gӱi ÿiӋn thѭ thì bҥn có thӇ dùng ngay VoviMail ÿӇ ÿánh chӳ ViӋt mà không cҫn
chҥy mӝt chѭѫng trình bên ngoài.
ÐiӅu kiӋn cҫn có ÿӇ viӃt và ÿӑc Unicode:
Operating system: Windows 95.bx, 98.x, 98 Me, NT4, Windows 2000
Professional, Windows 2000 Server and up
Browser: IE 4.x and IE 5.x., NE 6x, Netscape còn gһp nhiӅu trӣ ngҥi vӅ xӱ
lý Unicode.
Các ӭng dөng Unicode trong web site tiӃng ViӋt 26

Cách ÿánh chӳ ViӋt trong Hotmail

Sau khi vào trang Hotmail ÿӇ ÿӑc hay gӱi ÿiӋn thѭ, bҥn gõ vào Compose
trên menu bar ngang ÿӇ vào trang viӃt và chuyӇn ÿiӋn thѭ.
Gõ vào checkbox "Rich Text Format" (cҫn phҧi check vào ÿây thì mӟi có
thӇ xӱ lý Unicode) thì bҥn sӁ thҩy phҫn ÿánh chӳ và gӱi ÿiӋn thѭ nhѭ hình
sau:

NӃu bҥn dùng mӝt chѭѫng trình ÿánh chӳ ViӋt nhѭ Vps 4.0 thì bҥn có thӇ
ÿánh chӳ viӋt vào khung chӳ cӫa Hotmail ÿӇ gӱi bҵng font Unicode. Tuy
nhiên trong VPS 4.0 bҥn cҫn set ÿúng thì mӟi ÿánh ÿѭӧc ra chӳ ViӋt
Unicode. Muӕn vұy, bҥn vô phҫn tab Kӻ Thuұt - Bҧng Mã - Bҧng Sӱa Mã
cӫa Vps và chӑn :Unicode ÿӇ chӍ thӏ cho Vps dùng mã chӳ Unicode khi
ÿánh chӳ ViӋt.
Các ӭng dөng Unicode trong web site tiӃng ViӋt 27

Nhӳng Font sau ÿây có thӇ có glyphs Unicode chӳ ViӋt trong hӋ thӕng
Windows cӫa bҥn: Arial, Courier New, Times New Romance và Verdana.
Khi ÿánh chӳ ViӋt mà thҩy ô vuông thì bҥn cҫn chӑn mӝt trong nhӳng font
trên ÿӇ xem chӳ ViӋt hiӋn ra ÿúng hay không. NӃu không có font nào hiӋn
ÿúng chӳ ViӋt thì có nghƭa là fonts trong máy cӫa bҥn ÿã quá cNJ, bҥn cҫn
ÿӃn website cӫa Microsoft ÿӇ download fonts mӟi hѫn.
Các bҥn muӕn ÿánh chӳ ViӋt ÿӇ ngѭӡi ÿӑc có thӇ nhұn ÿúng chӳ ViӋt thì
bҥn có thӇ dùng VoviMail cӫa Vovisoft ÿӇ ÿánh chӳ ViӋt và chuyӇn ÿiӋn thѭ
ÿӃn ÿӏa chӍ ÿiӋn thѭ Hotmail.
Hotmail tӵ ÿӝng chuyӇn ÿúng chӳ ViӋt Unicode gӱi bҵng VoviMail và ngѭӡi
nhұn có hӝp thѭ Hotmail sӁ ÿӑc ÿѭӧc chӳ ViӋt tӭc thì.
ÐiӅu kiӋn cҫn có ÿӇ ÿӑc Unicode:
Operating system: Windows 95.bx, 98.x, 98 Me, NT4, Windows 2000
Professional, Windows 2000 Server and up
Browser: IE 4.x and IE 5.x., NE 6x, Netscape còn gһp nhiӅu trӣ ngҥi vӅ xӱ
lý Unicode.
Các ӭng dөng Unicode trong web site tiӃng ViӋt 28

Cách ÿánh chӳ ViӋt trong Yahoo! Mail

Muӕn ÿánh chӳ ViӋt bҵng font Unicode trong Yahoo! Mail, bҥn cҫn có
chѭѫng trình ÿánh chӳ ViӋt nhѭ Vps 4.0. Bҥn vô phҫn tab Kӻ Thuұt - Bҧng
Mã - Bҧng Sӱa Mã cӫa Vps và chӑn :Unicode ÿӇ chӍ thӏ cho Vps dùng mã
chӳ Unicode khi ÿánh chӳ ViӋt. Sau khi chҥy Vps vӟi setting nhѭ ÿã nói ӣ
trên, bҥn có thӇ gõ chӳ ViӋt vào khung chӳ cӫa Yahoo! Mail nhѭ hình sau:

Yahoo! sӁ trình bày Unicode chӳ ViӋt ÿúng hay sai tùy theo font có trong
máy cӫa bҥn. Trӣ ngҥi cӫa Yahoo là không ÿӇ font Tahoma cho ngѭӡi dùng
chӑn nên khi máy nào không có font Unicode chӳ ViӋt trong các font ÿһc
ÿӏnh trong Yahoo! Mail thì sӁ gһp trӣ ngҥi trong vҩn ÿӅ ÿӑc ÿiӋn thѭ. Bҥn có
thӇ làm mӝt cuӝc thӱ nghiӋm bҵng cách highlight mӝt phҫn chӳ ViӋt trong
khung chӳ rӗi chӑn tӯng font mӝt trong combobox Font. Bҥn sӁ thҩy có mӝt
Các ӭng dөng Unicode trong web site tiӃng ViӋt 29

sӕ font không cho hiӋn ÿúng chӳ ViӋt. Tҥi sao? Tҥi vì nhӳng font ÿó không
có glyhps Unicode chӳ ViӋt.
Các bҥn muӕn ÿánh chӳ ViӋt ÿӇ ngѭӡi ÿӑc có thӇ nhұn ÿúng chӳ ViӋt thì
bҥn có thӇ dùng VoviMail cӫa Vovisoft ÿӇ ÿánh chӳ ViӋt và chuyӇn ÿiӋn thѭ
ÿӃn ÿӏa chӍ ÿiӋn thѭ Yahoo!
Yahoo! Mail tӵ ÿӝng chuyӇn ÿúng chӳ ViӋt Unicode gӱi bҵng VoviMail và
ngѭӡi nhұn có hӝp thѭ Yahoo! sӁ ÿӑc ÿѭӧc chӳ ViӋt tӭc khҳc.
ÐiӅu kiӋn cҫn có ÿӇ viӃt và ÿӑc Unicode:
Operating system: Windows 95.bx, 98.x, 98 Me, NT4, Windows 2000
Professional, Windows 2000 Server and up
Browser: IE 4.x and IE 5.x.; NE 6x, Netscape còn gһp nhiӅu trӣ ngҥi vӅ xӱ
lý Unicode.

You might also like