ISO/IEC 2022
ISO 2022,全称ISO/IEC 2022,由国际标准化组织(ISO)及国际电工委员会(IEC)联合制定,是一个使用7位编码表示汉语文字、日语文字或朝鲜文字的方法。
ISO 2022等同于欧洲标准组织(ECMA)的ECMA-35、中国国标GB 2311、日本工业规格JIS X 0202(旧称JIS C 6228)及韩国工业规格KS X 1004(旧称KS C 5620)。
引言
英语可用7位编码储存,而其他使用拉丁字母、希腊字母、西里尔字母、希伯来字母等的语文,由于只使用数十个字母,传统上均使用8位编码的ISO/IEC 8859标准来表示。但由于汉语、日语及朝鲜语字数众多,无法用单一个8位字符来表达,故需要多于一个字节来代表一个字。于是,ISO 2022就设计出来让汉语、日语及朝鲜语可以使用数个7位编码的字符来示。
ISO 2022使用“逃逸字串”(Escape sequence)。逃逸字串由1个“ESC”字符(0x1B),再由两至三个字串组成。此标记代表它后面的字符,属于下表字符集的文字。
ISO 2022表达方式
以ISO 2022标准来编码的字集包括:
-
ISO-2022-JP - 日语文字
- ESC ( B 转为ASCII
- ESC ( J 转为JIS X 0201-1976
- ESC $ @ 转为JIS X 0208-1978
- ESC $ B 转为JIS X 0208-1983
-
ISO-2022-JP-1 - 于ISO-2022-JP的基础上,加上以下一组逃逸字串
- ESC $ ( D 转为JIS X 0212-1990
-
ISO-2022-JP-2 - 于ISO-2022-JP-1的基础上,加上以下四组逃逸字串,提供多语言支援
- ESC $ A 转为GB 2312-1980 (简体中文)
- ESC $ ( C 转为KS X 1001-1992 (朝鲜文)
- ESC . A 转为ISO 8859-1 (西欧拉丁字母)
- ESC . F 转为ISO 8859-7 (希腊字母)
-
ISO-2022-JP-3 - 于ISO-2022-JP的基础上,加上以下两组逃逸字串
- ESC $ ( O 转为JIS X 0213-2000第一字面
- ESC $ ( P 转为JIS X 0213-2000第二字面
-
ISO-2022-JP-2004 - 于ISO-2022-JP-3的基础上,加上以下一组逃逸字串
- ESC $ ( Q 转为JIS X 0213-2004第一字面
-
ISO-2022-KR - 朝鲜文
- ESC $ ) C 转为KS X 1001-1992
-
ISO-2022-CN - 中文
- ESC $ ) A 转为GB 2312-1980
- ESC $ ) G 转为CNS 11643-1992第一字面
- ESC $ * H 转为CNS 11643-1992第二字面
-
ISO-2022-CN-EXT - 于ISO-2022-CN的基础上,加上以下六组逃逸字串
- ESC $ ) E 转为ISO-IR-165
- ESC $ + I 转为CNS 11643-1992第三字面
- ESC $ + J 转为CNS 11643-1992第四字面
- ESC $ + K 转为CNS 11643-1992第五字面
- ESC $ + L 转为CNS 11643-1992第六字面
- ESC $ + M 转为CNS 11643-1992第七字面