CNS 11643(中文标准交换码)
中文标准交换码,编号CNS 11643,是台湾为资讯交换而制定的标准编码方案,与CCCII同属于中文交换码。
1980年9月行政院国家科学委员会集合国内编码专家、学者在溪头举行会议并达成初步原则,并据此请行政院核定国家中文资讯标准交换码编码原则。经过多次会商,在1986年8月4日正式由中央标准局公布,取名“通用汉字标准交换码”,简称“通用码”(UCS)。
当时的内容包括第一字面、第二字面共13,051字,经过多年的使用意见及反映,于1992年扩编至第七字面,共48,027字,并改称“中文标准交换码”(CSIC, Chinese Standard Interchange Code)。此后陆续充实内容,1992年版一共十六字面,使用至第七字面;2004年版一共六十字面,使用至第十五字面。
原先此码冀以替代业界采用的大五码 (Big5)。但由于通用码需要3个字节来记录一个汉字,以当时内存的发展并不允许,在程式相容性产生许多的困难。结果除了主要采用大型电脑和迷你电脑的户政役系统采用以外,一般民间乏人问津。
版本
年份 |
标准名称 |
更改 |
---|---|---|
2004 |
CNS11643-2004 |
扩充至八十字面 |
1992 |
CNS11643-1992 |
原1986版本中第十四字面的字分散于第三至四字面中 |
1986 |
CNS11643-1986 |
编码结构
2004年版CNS 11643字面配置如下:
- 第一字面:字码区间2121h至4243h为符号区(4242h 新增欧元符号€,4243h 新增国字〇);字码区间4421h至7D4Bh,共编入中文字5,401个;字集来源除教育部“常用国字标准字体表”所列4,808字外,并优先收编国中、国小教科书中常用字587字及异体字6字。
- 第二字面:字码区间由2121h至7244h,故编入中文字7,650个,字集来源除教育部“次常用国字标准字体表”所列6,330字外,并筛选编入教育部“罕用国字标准字体表”表中使用频率较高之1,320字。
- 第三字面:字码区间2121h至6246h,共编入中文字6,148个,字集来源为77年6月行政院主计处电子处理资料中心暂编之使用者加字区第14字面前段;字码区间6448h至672Ah为247个美国与香港提报字。
- 第四字面:字码区间2121h至6E5Ch,共编入中文字7,298个,字集来源除77年6月行政院主计处电子处理资料中心暂编之使用者加字区第14字面后段171字外,并加入户役政及其他使用单位、ISO/IEC 10646-2:2001 汉字集、资讯业次常用字7,127字。
- 第五字面:字码区间2121h至7C51h,目前编入中文字8,603个字,字集来源为未编入前4个字面之教育部罕用字。
- 第六字面:字码区间2121h至647Ah,共编入中文字6,388个,字集来源为未编入前5个字面,且笔画在14画(含)以下之教育部异体字。
- 第七字面:字码区间2121h至6655h,共编入中文字6,539个,字集来源为未编入前6个字面,且笔画在15画(含)以上之教育部异体字。
- 第八字面:ISO/IEC 10646:2003 基本多文种平面中,未收录到原 CNS 11643 版本中的非汉字。
- 第九字面:ISO/IEC 10646:2003 基本多文种平面中,未收录到原 CNS 11643 版本中的非汉字。
- 第十字面:ISO/IEC 10646:2003 表意文字补充平面中,未收录到原 CNS 11643 版本中的汉字。
- 第十一字面:字码区间2121h至4840h为 ISO/IEC 10646:2003 表意文字补充平面中,未收录到原 CNS 11643 版本中的汉字;字码区间4921h至733Dh为地政字、国语会闽南语母语用字。
- 第十二字面:字码区间2121h至756Ah为户政字
- 第十三字面:字码区间2124h至732Ah为户政字
- 第十四字面:字码区间2121h至4B6Ch为户政字;字码区间4B6Dh至6D79h为 ISO/IEC 10646:2003 中未收录到原 CNS 11643 版本中的汉字。
- 第十五字面:字码区间2121h至6D39h,共编入中文字6,831个;字集来源为户役政作业第十五字面。
- 第十六字面:私人造字区
- 第17~第80字面保留供未来使用。