• 字体
  • 字体家族
  • 字体公司
  • 字体设计师
  • 字体样张
  • 资讯
  • 帮助
字客网>资讯>详情

文泉驿:中文字体开源的先驱之旅

时间:2006-10-24 11:36:25| 业界|浏览:671|来源:《软件世界》|作者:房骞骞
导语中文字体一直阻碍着开源操作系统的普及和推广,文泉驿计划经过两年来无数辛勤劳动的开源爱好者的共同努力,已经取得一定的成就,一些商业、社区Linux发行版均采用文泉驿字体作为默认的中文字体。字体是一种特殊的软件,随着国外开源操作系统(BSD系列和GNU/Linux)的发

中文字体一直阻碍着开源操作系统的普及和推广,文泉驿计划经过两年来无数辛勤劳动的开源爱好者的共同努力,已经取得一定的成就,一些商业、社区Linux发行版均采用文泉驿字体作为默认的中文字体。

字体是一种特殊的软件,随着国外开源操作系统(BSD系列和GNU/Linux)的发展也带来了开源字体。相比起来,开源软件和开源操作系统在中国的发展却远远落后于国外,无论从使用者、开发者的数量,贡献开源软件的数量和质量,社区的规模和总体技术开发能力,都与国外有一定的距离。

除了开源文化在国内传播尚需时日这一个主要原因之外,中文化的不完善,尤其是中文字体、输入法和中文文档的匮乏也阻碍了开源操作系统在中国的发展。

当国外用户已经在大规模利用自由软件的便捷与强大功能去完成各种各样复杂的工作时,中文用户还未解决最基本的中文显示和输入问题,缺字、乱码、显示模糊、字体破碎等问题几乎是每个Linux初学者的必修课。这种现状对于Linux在中文社区的发展造成极大的阻碍。

开源中文字体状况

早期最具影响的开源中文字体是中科院在1988年发布的16x15像素的点阵宋体,包含了GB2312编码的6763个汉字和其他中文字符,这个字体现在作为Xorg/XFree86核心字体的一部分,默认安装在几乎所有的Linux系统中。

由于点阵字体无法防缩,当显示大字号或者打印时,效果不甚理想,所以从90年代开始,矢量字体(即通过数学曲线描述的轮廓字体)成为主流。遗憾的是,覆盖简体中文的矢量开源字体只有中国台湾省文鼎公司1999年贡献给开源社区的宋体和楷体两个字体(以及从这个字体衍生的firefly和CJK Unifonts字体)。

开源字体之外,还有一些免费字体(用户可免费使用,但不能修改和再发布,而且大多数不许用于商业用途)可供中文Linux用户选择,这其中包括中国香港特别行政区ISO10646明体、中国台湾省的OpenSung和OpenKai字体、双桥免费字体和Code2000/Code2001 Unicode字体等。

这些字体跟高质量商用中文字体比较,一般缺少专门为屏幕显示的嵌入字符点阵,而且也不包含边界显示优化的Hinting指令。由于免费字体用户只有使用权而没有修改权,所以开源社区无法在其基础上改进和完善。

近年,国际上的主流Linux发行版默认的中文字体,一般采用文鼎公司贡献的开源字体及其衍生字体,特别是2004年由中国台湾省志愿者Firefly完成的嵌入点阵文鼎矢量字体(AR PL New Sung)和由旅居中国台湾省的德国人Arne与中国香港特别行政区的开放系统研用协会(OAKA)的Akar Chen等在文鼎字体基础上组织开发的CJK Unifonts字体。

而国内的一些Linux发行版(如红旗、共创等),则倾向于从字体开发商购买商用字体使用权,字体虽然可以使用了,但本身并非开源,这与开源文化无法地融合,再加上费用昂贵,故而国外的主要Linux开发社区不倾向于这种做法。

文泉驿计划目的与进展

发起文泉驿计划的初衷是为了从根本上改变自由中文字体匮乏的现状,开发高质量、多规格、多字体风格的开源中文字体(点阵字体和矢量字体),解决中文Linux发展的字体障碍,为中文发行版、开源中文软件的开发扫清障碍,降低中文Linux的使用门槛,从而让更多的人接触和使用Linux。

文泉驿计划正式开始于2004年10月,计划的第一步是在Firefly点阵的基础上开发完整覆盖Unicode中日韩统一表意文字区(共20902个汉字,等同于GBK字符集)在四个屏幕常用字号上的点阵字体,这个工作在王宏(Wanghong/hotcat)等志愿者的推动下于2005年4月完成,共绘制完成了新点阵约15000多个,优化原有的Firefly点阵数万余个,并于2005年6月正式发布了文泉驿点阵宋体,这个字体经过不懈的改进,现在已经发布了三次主要更新(代号分别为文泉半两、苍龙、北斗)。

从2005年4月开始,同时开展了两个开发子任务:一个将是点阵字体开发扩展到中日韩表意文字扩展A区(共6582个汉字),在志愿者Nicholas Wang的积极参与下,这个工作也在今年年中顺利完成。

此任务共绘制新点阵23000多个,与前面完成的字体结合,并加上今年国家正式执行的强制性国家标准GB 19966-2005中的15x16点阵(由于是强制性国家标准,所以这些点阵已经进入共有领域),已经具备了完整的GB18030中文字符集覆盖,这个具有历史性的点阵字体将作为“文泉驿点阵宋体”1.0(代号为英雄)计划在今年10月底正式发布。

另外一个主要子任务是开发高质量矢量字体,这个工作从2005年5月开始,到现在已经完成了19600个常用汉字及10000多非常用汉字的笔画分解工作,而后面进行字体生成的算法和程序也在紧锣密鼓地开发中。相信到今年年底文泉驿矢量字体预览版可以与广大Linux用户见面。

文泉驿字体开发过程大多数是通过一个改写的Wiki及部分离线编辑软件完成。特别是在线点阵编辑部分是开发的一个重要环节和工具,由于Wiki本身具备了强大的协同开发能力,具有良好的版本控制和信息组织机制,同时汉字编辑本身具有很好的可并行性和颗粒化特性,所以该平台在整个开发过程当中显示了强大的生命力。

笔者最近又完成了“每日自动编译新字体”(nightly build)的功能,这样用户对不满意汉字进行在线修改,如果管理员接受修改,用户第二天就可以下载到修改后的字体点阵。

由于文泉驿点阵能够克服大多数纯中文矢量字体边缘模糊不清、不易阅读的缺点,而且风格统一,字型严格按照Unicode和国家标准制作,加之版权、授权明晰,在发布后的一年内,已经被部分Linux发行版本接受作为默认屏幕中文字体,这其中包括Mandriva、Magic Linux、Knoppix中文版、FanX和RelaxBSD等。此外,更多地发行版将文泉驿纳入他们的软件仓库,提供用户动态更新下载,这其中包括Debian(testing/unstable)、Ubuntu(dapper/edgy)、Gentoo、Fedora-cn,以及Frugalware Linux。相信随着新版本的推出和时间的发展,会有更多的Linux发行版采用文泉驿开源字体。

面临的困难

尽管文泉驿已经发布了开源的字体,但在问卷调查显示,仍然有一半以上的用户在拷贝和使用未经授权的商业字体,特别是直接使用Windows系统中的中文字体。造成这种状况的原因有多个,其中一个主要原因是Linux用户虽然从形式上使用了开源操作系统,但并未真正领悟开放、协作、创造的自由软件精神。

这种状况导致的直接后果就是自由软件使用者没有参与自由软件开发的动力,一些人宁愿去违背自由软件原则去使用不合法的软件,而不愿意去为开源项目贡献一份自己的力量。

尽管笔者认为开发开源字库是中文开源软件的一块重要基石,对于整个软件产业的和谐发展具有战略性意义。尽管现在已经花费了两年时间完成了部分开源的中文字体,但并没有收到任何来自决策部门的资助和明确表态。

另外一个困难是由于资金的限制,计划的进展一直没有想象中的迅速,参与者的积极性也非常有限,网站的规模也因此受到很大程度的限制。虽然陆续收到了一些热心朋友的汇款资助,基本解决了一年之内的网站租用和购买必要资料的费用,但从计划长期发展的角度,还需要任何机构、基金、Linux开发商或者个人能够伸出援助之手。

文泉驿计划展望

文泉驿计划打算在近期推出一个新的点阵字体版本,这个版本将包含符合国家标准的15x16点阵字型和数千个通过参与者在线改进的点阵,这个版本还较好地解决了文泉驿点阵字与系统上已经安装的矢量字配合显示的问题,通过字体别称,Linux下Windows模拟器执行中文程序的速度也得以提升。随后,将发布覆盖GB18030字符集的点阵字体1.0版本世,这将是文泉驿点阵字体的一个重要里程碑。

矢量部分的开发还有很多工作,包括字型的规范化,对于常见汉字,工作量最大的笔画分解工作已经基本完成。在后面的工作中会对这些分解数据中通过算法生成黑体、圆体和宋体等基本字体。如果进展顺利,相信在年底之前,这些字体当中的一个或者多个能够与大家见面。

点阵字体方面除了不断优化改进之外,今后可能会发展多色阶点阵中文字体,通过调整参数实现矢量字体无法达到的清晰度与平滑度的均衡。此外,汉字hinting算法在国际上也是一个难题,也希望在这个方面有所尝试。

除了字体外,还计划了很多开源中文方面的开发工作,包括汉字的图像识别、笔画识别、语音识别和合成、少数民族字体的开发等。还有一个工作就是开发开源汉语语料库,这个库可以为各种汉语输入法提供词库素材。目前测试页面已经编写完成,相信过一段将会在主页正式发布。

迄今为止,所有参与文泉驿自由中文开发的朋友付出的工作都是无偿的,他们付出了数千小时的劳动,绘制出接近商业字体品质的开源点阵,希望利用这一机会向他们无私的劳动致敬。

参与开源,并不一定非要会写Kernel,甚至不一定非要会编程,开源是一种心情、一种信仰、一种生活方式。重要的并不是你做什么,而是从现在做起,也许从一个点阵和一个矢量汉字分析做起。文泉驿计划的网站是http://wenq.org,这里也许能够找到参与开源的最初体验。

开放的电子汉字标准

文泉驿希望完成覆盖Unicode 4.0所包含的7万多汉字的点阵位图(9pt、10pt、11pt和12pt等)、笔画笔顺数据库及基于笔画笔顺数据库生成的不同字型(细宋,中宋和报宋等)的矢量汉字库。

这个工作还可以继续扩展到对所有汉字进行注音、释义,通过笔画笔顺进行汉字检索和分类,少数民族语言文字的点阵和矢量字体,以及汉字图像识别和笔画识别算法软件的开发。当前正在努力完成的是计划当中的第一步,即制作点阵汉字图像,今后还可能发展矢量汉字库。

链接:关于文源驿开源字体项目

作为几千年中华文明的见证,浩瀚传统文化传承的载体,汉字是让我们每一个中国人引以为豪的东方文明的标志之一。我们的祖先创造汉字、书写汉字、利用汉字和汉语的无穷魅力创造出让人叹为观止的文学、艺术。而今天进入了计算机时代的我们,虽然不再象古人一样手持毛笔,批著简帛,但我们的生活仍然无时无刻离不开汉字。

文泉驿项目是一群致力于在计算机世界中推广汉字,丰富电子汉字资源的人们,希望通过自己无私的劳动,使得无论用户在世界上任何一个角落,都可以免费地获得我们的电子汉字资源,能够流畅地通过汉字进行交流。“文泉驿”是以上述目标为宗旨的的非赢利性组织。

文泉驿项目制作的点阵汉字字库将可以使用在各种主流计算机操作系统上,特别是同样基于开放源代码的Linux操作系统。

对于制作电子汉字资源,文泉驿制定了如下子计划:

◆基于开放原代码的点阵汉字库(优化屏幕显示);

◆基于开放原代码的矢量汉字库;

◆基于开放原代码的汉字笔画笔序数据库;

◆基于开放原代码的汉字图像识别系统;

◆基于开放原代码的汉字笔画识别系统;

◆基于开放原代码的汉字信息系统(解释,编码等)。

0
  • 关注字客网公众号领取Z码
  • 关注字体先森公众号抽取SVIP
相关字体公司
文泉驿:中文字体开源的先驱之旅 网友点评
游客:文明上网,理性发言。 看不清?换一张
文泉驿:中文字体开源的先驱之旅 最新评论
暂无相关评论