• 字体
  • 字体家族
  • 字体公司
  • 字体设计师
  • 字体样张
  • 资讯
  • 帮助
字客网>资讯>详情

HKSCS(香港增补字符集)

时间:2008-05-27 22:41:43| 术语|浏览:1695|作者:
导语字符集名称:Big5-HKSCS香港增补字符集(Hong Kong Supplementary Character Set,HKSCS)是香港政府基于繁体中文电脑操作环境中最流行的大五码(Big5)之上扩展的字符集标准,是现时香港的中文资讯交换内码标

字符集名称:Big5-HKSCS

香港增补字符集(Hong Kong Supplementary Character Set,HKSCS)是香港政府基于繁体中文电脑操作环境中最流行的大五码(Big5)之上扩展的字符集标准,是现时香港的中文资讯交换内码标准。

字符集所收罗的字,主要包括香港的地名、人名用汉字、粤语汉字及异体字,也有小部份简体字。除此之外,此字符集亦把倚天中文系统收录的日语平假名、片假名及俄语字母包括在内。此字符集由中文界面咨询委员会管理,仍在不断扩编之中。最新版本为2005年5月推出的 HKSCS-2004,收录 4,941 个字符。

版本

版本

字数

发表时间

HKSCS-2004+追加字

5000

2008年2月

HKSCS-2004+追加字

4,969

2006年11月

HKSCS-2004

4,941

2005年5月

HKSCS-2001

4,818

2001年12月

HKSCS-1999

4,702

1999年9月

GCCS

3,049

1995年

起源

1980年代中期, 台湾的中文电脑的通行内码为Big5编码。1990年代初期,香港电脑应用逐渐普及,而政府各部门也电脑化。和台湾一样,香港也是使用繁体中文的地方,是故也采用了Big5编码。可是Big5码本身没有收录香港常用的广东字、一些人名地名用字、一些学科用字,于是香港政府各部门使用Big5的外字区,自行补上这些字,并在政府内部使用。香港业界也不断要求政府,本地需要一套标准字符集来作电子文件来往。到1995年,互联网在香港起步,而政府也推出了自己的网站。各人电脑的中文系统虽然都用Big5编码, 但都没有政府用的外字,更可能用了自己的外字,使在浏览网页时不能显示正确的字符。香港政府于是把内部使用的Big5外字集公开,让各界可以下载安装这批字,使电脑能显示正确的字符,并把这套字命名为“政府通用字库”。

负责机构

负责整套字符集管理的为中文界面咨询委员会, 简称“中咨会”,英文名Chinese Language Interface Advisory Committee (CLIAC)。1999年5月由前资讯科技署成立, 现隶属“政府资讯科技总监办公室”。中咨会辖下有两个工作小组: 中文电脑用字工作小组、中文资讯科技工作小组。中文电脑用字工作小组审核待增收字符, 纳入和编配码位等工作;中文资讯科技工作小组解决技术问题及与国际标准 ISO/IEC 10646(简称 ISO 10646)接轨等工作。各组成员来自学术界、语言学界、出版界和资讯科技界等。

和Big5的关系

香港增补字符集当初因为是补充Big5的收字不足,使用其外字区而发展的,所以受制于Big5的编码架构,外字的总数最多只能到 6217 个(每区块 157 字,有 39 区块半)。除去已用码位,剩下千余个码位,其中有部分会保留给用户造字。

早期的倚天中文系统、国乔中文系统等对造字缺乏管理,而又没有文字专家的审定,因此当时造字很是混乱,有些甚至可能只是临时使用的“错字”(寻遍各大字典、专书也查不到的字,也作幽灵汉字);制作这些中文系统的厂商又对字形、字体缺乏认识,有些字会因为字体不同而字形稍有差别,分别编进了两个码位中。又有同一字有系统区及造字区两个码位,有些联绵词只收其一不收其二;这个问题带到了政府通用字库和香港增补字符集中,字集因要反向兼容而跳过了一些码位。

Big-5 原来的编码,只有汉字、标点、注音符号等字符及少数图形,后来经过台湾厂商的增收,多了 7 个“倚天字”(即碁、銹、裏、墻、恒、粧、嫺)及日文的假名,最后这批字符又被香港增补字符集收入。

香港增补字符集所使用的Big5的外字区分几个区段:

  • “造字区一”(FA40 — FEFE):早期的 GCCS 字符集已经填满这一段。
  • “造字区二”(C6A1 — C8FE):倚天用了这段来放日文假名等符号。这些符号在 HKSCS 1999年的版本被收纳。
  • “造字区三”(8140 — A0FE):香港增补字符集把这段开头的 (8140 — 84FE) 保留给用户,新增的字符只用其余的码位。
  • “厂商造字区”(F9D6 — F9FE):这段开始的七个码位用来存放裏、恒等“倚天字”,之后的码位被微软的繁体中文 Windows 用来存放制表符号。后来 HKSCS 1999年版本将之全部收纳。

可是一般提及 HKSCS 的文件,包括来自香港政府的,都没有注明 HKSCS 以外的一般繁体字编码(即是Big5本身)使用哪个版本。Big-5 在2003年前就只有一个版本,不会造成混淆,但 HKSCS-2004 的文件仍没有指定Big5部份是2003年之后还是之前的版本,虽然到目前为止并没有任何系统使用 Big5-2003。

和 ISO 10646/Unicode 的关系

1995年的政府通用字库本来是内部使用的,到 1999年才成立中咨会专门去负责增收及审核字符的工作,并与 ISO 10646 接轨。中咨会的成员会把香港增补字符集交到 ISO 的表意文字小组中,尽量让其所有字符纳入国际标准。表意文字小组会定期开会审议汉字的收纳等工作, 成员是来自世界各地的专家。

香港字在 Big5-HKSCS 内的码位,都能对应到 ISO 10646 中日韩汉字区段中的码位,或 Private Use Area(用户造字区,简称 PUA)内。随着版本的更新,造字区的字会逐渐搬到中日韩汉字扩展区内。将所有已纳入的 HKSCS 字符搬到正式中日韩汉字扩展区段(非 PUA 区段)的工作在2005年完成,对应于 ISO 10646:2003 的第一修订版,相应的 Unicode 版本为 Unicode 4.1。

不过,因为目前流传极多使用旧版 HKSCS 的系统产生出来的文件,为了方便过渡,在 HKSCS 的定义中,在 Unicode PUA 所分配的字符位置会予以保留,不会给新加入而且未分配正式 Unicode 位置的字符使用。

增补字符集更改增收原则

《香港增补字符集》自2008年3月31日起更改字符增收原则,新增的字符只会编配ISO 10646国际编码标准内码,不再编配大5码内码。政府资讯科技总监办公室表示,全面采用ISO 10646国际编码,可统一编码标准,解决兼容问题。ISO 10646国际编码标准涵盖各种主要语文的字符,包括繁体及简体中文字,提供统一的字符编码标准,方便世界各地的电脑用户。《香港增补字符集》3月31日起更改字符增收原则,在此之前获编配的字符,则不受影响。政府1999年公布《香港增补字符集》,由中文界面咨询委员会负责管理,收纳适用于香港的中文电脑用字,以解决电子通讯出现乱码或字符不能正确地显示等问题。

0
  • 关注字客网公众号领取Z码
  • 关注字体先森公众号抽取SVIP
相关字体公司
HKSCS(香港增补字符集) 网友点评
游客:文明上网,理性发言。 看不清?换一张
HKSCS(香港增补字符集) 最新评论
暂无相关评论