ISO/IEC 8859
ISO 8859,全称ISO/IEC 8859,是国际标准化组织(ISO)及国际电工委员会(IEC)联合制定的一系列8位字符集的标准,现时定义了15个字符集。
引言
ASCII收录了空格及94个“可印刷字符”,足以给英语使用。但是,其他使用拉丁字母的语言(主要是欧洲国家的语言),都有一定数量的变音字母,故可以使用ASCII及控制字符以外的区域来储存及表示。
除了使用拉丁字母的语言外,使用西里尔字母的东欧语言、希腊语、泰语、现代阿拉伯语、希伯来语等,都可以使用这个形式来储存及表示。
各种ISO 8859字符集
- ISO/IEC 8859-1 (Latin-1) - 西欧语言
- ISO/IEC 8859-2 (Latin-2) - 中欧语言
- ISO/IEC 8859-3 (Latin-3) - 南欧语言。世界语也可用此字符集显示。
- ISO/IEC 8859-4 (Latin-4) - 北欧语言
- ISO/IEC 8859-5 (Cyrillic) - 斯拉夫语言
- ISO/IEC 8859-6 (Arabic) - 阿拉伯语
- ISO/IEC 8859-7 (Greek) - 希腊语
- ISO/IEC 8859-8 (Hebrew) - 希伯来语
- ISO/IEC 8859-9 (Latin-5 或 Turkish) - 它把Latin-1的冰岛语字母换走,加入土耳其语字母。
- ISO/IEC 8859-10 (Latin-6 或 Nordic) - 北日耳曼语支,用来代替Latin-4。
- ISO/IEC 8859-11 (Thai) - 泰语,从泰国的 TIS620 标准字集演化而来。
- ISO/IEC 8859-13 (Latin-7 或 Baltic Rim) - 波罗的语族
- ISO/IEC 8859-14 (Latin-8 或 Celtic) - 凯尔特语族
- ISO/IEC 8859-15 (Latin-9) - 西欧语言,加入Latin-1欠缺的芬兰语字母和大写法语重音字母,以及欧元(€)符号。
- ISO/IEC 8859-16 (Latin-10) - 东南欧语言。主要供罗马尼亚语使用,并加入欧元符号。
由于英语没有任何重音字母(不计外来词),故可使用以上十五个字集中的任何一个来表示。
至于德语方面,因它除了 A-Z, a-z 外,只用 Ä, Ö, Ü, ä, ö, ß, ü 七个字母,而所有拉丁字集(1-4, 9-10, 13-16)均有此七个字母,故德语可使用以上十个字集中的任何一个来表示。
此系列中没有-12号的原因是,此计划原本要设计成一个包含塞尔特语族字符集的“Latin-7”,但后来塞尔特语族变成了ISO 8859-14 / Latin-8。亦有一说谓-12号本来是预留给印度天城体梵文的,但后来却搁置了。
基本结构
每个字集定义最多96个字母或符号,在0xA0-0xFF根据不同字符集放入不同的字符。
Bin |
Oct |
Dec |
Hex |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
13 |
14 |
15 |
16 |
|
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
10100000 |
240 |
160 |
A0 |
NBSP |
|||||||||||||||
10100001 |
241 |
161 |
A1 |
¡ |
Ą |
Ħ |
Ą |
Ё |
‘ |
¡ |
Ą |
ก |
” |
Ḃ |
¡ |
Ą |
|||
10100010 |
242 |
162 |
A2 |
¢ |
˘ |
˘ |
ĸ |
Ђ |
’ |
¢ |
¢ |
Ē |
ข |
¢ |
ḃ |
¢ |
ą |
||
10100011 |
243 |
163 |
A3 |
£ |
Ł |
£ |
Ŗ |
Ѓ |
£ |
£ |
£ |
Ģ |
ฃ |
£ |
£ |
£ |
Ł |
||
10100100 |
244 |
164 |
A4 |
¤ |
¤ |
¤ |
¤ |
Є |
¤ |
€ |
¤ |
¤ |
Ī |
ค |
¤ |
Ċ |
€ |
€ |
|
10100101 |
245 |
165 |
A5 |
¥ |
Ľ |
Ĩ |
Ѕ |
₯ |
¥ |
¥ |
Ĩ |
ฅ |
„ |
ċ |
¥ |
„ |
|||
10100110 |
246 |
166 |
A6 |
¦ |
Ś |
Ĥ |
Ļ |
І |
¦ |
¦ |
¦ |
Ķ |
ฆ |
¦ |
Ḋ |
Š |
Š |
||
10100111 |
247 |
167 |
A7 |
§ |
§ |
§ |
§ |
Ї |
§ |
§ |
§ |
§ |
ง |
§ |
§ |
§ |
§ |
||
10101000 |
250 |
168 |
A8 |
¨ |
¨ |
¨ |
¨ |
Ј |
¨ |
¨ |
¨ |
Ļ |
จ |
Ø |
Ẁ |
š |
š |
||
10101001 |
251 |
169 |
A9 |
© |
Š |
İ |
Š |
Љ |
© |
© |
© |
Đ |
ฉ |
© |
© |
© |
© |
||
10101010 |
252 |
170 |
AA |
ª |
Ş |
Ş |
Ē |
Њ |
ͺ |
× |
ª |
Š |
ช |
Ŗ |
Ẃ |
ª |
Ș |
||
10101011 |
253 |
171 |
AB |
« |
Ť |
Ğ |
Ģ |
Ћ |
« |
« |
« |
Ŧ |
ซ |
« |
ḋ |
« |
« |
||
10101100 |
254 |
172 |
AC |
¬ |
Ź |
Ĵ |
Ŧ |
Ќ |
، |
¬ |
¬ |
¬ |
Ž |
ฌ |
¬ |
Ỳ |
¬ |
Ź |
|
10101101 |
255 |
173 |
AD |
|
|
|
|
|
|
|
|
|
|
ญ |
|
|
|
|
|
10101110 |
256 |
174 |
AE |
® |
Ž |
Ž |
Ў |
® |
® |
Ū |
ฎ |
® |
® |
® |
ź |
||||
10101111 |
257 |
175 |
AF |
¯ |
Ż |
Ż |
¯ |
Џ |
― |
¯ |
¯ |
Ŋ |
ฏ |
Æ |
Ÿ |
¯ |
Ż |
||
10110000 |
260 |
176 |
B0 |
° |
° |
° |
° |
А |
° |
° |
° |
° |
ฐ |
° |
Ḟ |
° |
° |
||
10110001 |
261 |
177 |
B1 |
± |
ą |
ħ |
ą |
Б |
± |
± |
± |
ą |
ฑ |
± |
ḟ |
± |
± |
||
10110010 |
262 |
178 |
B2 |
² |
˛ |
² |
˛ |
В |
² |
² |
² |
ē |
ฒ |
² |
Ġ |
² |
Č |
||
10110011 |
263 |
179 |
B3 |
³ |
ł |
³ |
ŗ |
Г |
³ |
³ |
³ |
ģ |
ณ |
³ |
ġ |
³ |
ł |
||
10110100 |
264 |
180 |
B4 |
´ |
´ |
´ |
´ |
Д |
΄ |
´ |
´ |
ī |
ด |
“ |
Ṁ |
Ž |
Ž |
||
10110101 |
265 |
181 |
B5 |
µ |
ľ |
µ |
ĩ |
Е |
΅ |
µ |
µ |
ĩ |
ต |
µ |
ṁ |
µ |
” |
||
10110110 |
266 |
182 |
B6 |
¶ |
ś |
ĥ |
ļ |
Ж |
Ά |
¶ |
¶ |
ķ |
ถ |
¶ |
¶ |
¶ |
¶ |
||
10110111 |
267 |
183 |
B7 |
· |
ˇ |
· |
ˇ |
З |
· |
· |
· |
· |
ท |
· |
Ṗ |
· |
· |
||
10111000 |
270 |
184 |
B8 |
¸ |
¸ |
¸ |
¸ |
И |
Έ |
¸ |
¸ |
ļ |
ธ |
ø |
ẁ |
ž |
ž |
||
10111001 |
271 |
185 |
B9 |
¹ |
š |
ı |
š |
Й |
Ή |
¹ |
¹ |
đ |
น |
¹ |
ṗ |
¹ |
č |
||
10111010 |
272 |
186 |
BA |
º |
ş |
ş |
ē |
К |
Ί |
÷ |
º |
š |
บ |
ŗ |
ẃ |
º |
ș |
||
10111011 |
273 |
187 |
BB |
» |
ť |
ğ |
ģ |
Л |
؛ |
» |
» |
» |
ŧ |
ป |
» |
Ṡ |
» |
» |
|
10111100 |
274 |
188 |
BC |
¼ |
ź |
ĵ |
ŧ |
М |
Ό |
¼ |
¼ |
ž |
ผ |
¼ |
ỳ |
Œ |
Œ |
||
10111101 |
275 |
189 |
BD |
½ |
˝ |
½ |
Ŋ |
Н |
½ |
½ |
½ |
― |
ฝ |
½ |
Ẅ |
œ |
œ |
||
10111110 |
276 |
190 |
BE |
¾ |
ž |
ž |
О |
Ύ |
¾ |
¾ |
ū |
พ |
¾ |
ẅ |
Ÿ |
Ÿ |
|||
10111111 |
277 |
191 |
BF |
¿ |
ż |
ż |
ŋ |
П |
؟ |
Ώ |
¿ |
ŋ |
ฟ |
æ |
ṡ |
¿ |
ż |
||
11000000 |
300 |
192 |
C0 |
À |
Ŕ |
À |
Ā |
Р |
ΐ |
À |
Ā |
ภ |
Ą |
À |
À |
À |
|||
11000001 |
301 |
193 |
C1 |
Á |
Á |
Á |
Á |
С |
ء |
Α |
Á |
Á |
ม |
Į |
Á |
Á |
Á |
||
11000010 |
302 |
194 |
C2 |
 |
 |
 |
 |
Т |
آ |
Β |
 |
 |
ย |
Ā |
 |
 |
 |
||
11000011 |
303 |
195 |
C3 |
à |
Ă |
à |
У |
أ |
Γ |
à |
à |
ร |
Ć |
à |
à |
Ă |
|||
11000100 |
304 |
196 |
C4 |
Ä |
Ä |
Ä |
Ä |
Ф |
ؤ |
Δ |
Ä |
Ä |
ฤ |
Ä |
Ä |
Ä |
Ä |
||
11000101 |
305 |
197 |
C5 |
Å |
Ĺ |
Ċ |
Å |
Х |
إ |
Ε |
Å |
Å |
ล |
Å |
Å |
Å |
Ć |
||
11000110 |
306 |
198 |
C6 |
Æ |
Ć |
Ĉ |
Æ |
Ц |
ئ |
Ζ |
Æ |
Æ |
ฦ |
Ę |
Æ |
Æ |
Æ |
||
11000111 |
307 |
199 |
C7 |
Ç |
Ç |
Ç |
Į |
Ч |
ا |
Η |
Ç |
Į |
ว |
Ē |
Ç |
Ç |
Ç |
||
11001000 |
310 |
200 |
C8 |
È |
Č |
È |
Č |
Ш |
ب |
Θ |
È |
Č |
ศ |
Č |
È |
È |
È |
||
11001001 |
311 |
201 |
C9 |
É |
É |
É |
É |
Щ |
ة |
Ι |
É |
É |
ษ |
É |
É |
É |
É |
||
11001010 |
312 |
202 |
CA |
Ê |
Ę |
Ê |
Ę |
Ъ |
ت |
Κ |
Ê |
Ę |
ส |
Ź |
Ê |
Ê |
Ê |
||
11001011 |
313 |
203 |
CB |
Ë |
Ë |
Ë |
Ë |
Ы |
ث |
Λ |
Ë |
Ë |
ห |
Ė |
Ë |
Ë |
Ë |
||
11001100 |
314 |
204 |
CC |
Ì |
Ě |
Ì |
Ė |
Ь |
ج |
Μ |
Ì |
Ė |
ฬ |
Ģ |
Ì |
Ì |
Ì |
||
11001101 |
315 |
205 |
CD |
Í |
Í |
Í |
Í |
Э |
ح |
Ν |
Í |
Í |
อ |
Ķ |
Í |
Í |
Í |
||
11001110 |
316 |
206 |
CE |
Î |
Î |
Î |
Î |
Ю |
خ |
Ξ |
Î |
Î |
ฮ |
Ī |
Î |
Î |
Î |
||
11001111 |
317 |
207 |
CF |
Ï |
Ď |
Ï |
Ī |
Я |
د |
Ο |
Ï |
Ï |
ฯ |
Ļ |
Ï |
Ï |
Ï |
||
11010000 |
320 |
208 |
D0 |
Ð |
Đ |
Đ |
а |
ذ |
Π |
Ğ |
Ð |
ะ |
Š |
Ŵ |
Ð |
Đ |
|||
11010001 |
321 |