此页面上的内容需要较新版本的 Adobe Flash Player。

获取 Adobe Flash Player

当前位置:首页 > 局庆进行时 > 《新华书目报》:专业生产嘉惠学术文化界——中华书局总编辑徐俊谈数字出版建设

《新华书目报》:专业生产嘉惠学术文化界——中华书局总编辑徐俊谈数字出版建设

添加时间:2012-3-19 12:01:22查看

http://a.xhsmb.com/html/2012-03/12/content_41673.htm

记者 赵晶

百年老店中华书局曾经以点校本“二十四史”、《资治通鉴》等诸多古籍产品在热爱中国传统文化的读书人心目中留下深刻印象。步入数字出版时代,中华书局以“弘扬传统,服务学术”为宗旨,以成为全球最具影响力、具有强大经济实力和旺盛创新力的推广中国传统文化的顶尖出版社为目标,以多元化呈现方式使百年老店的优良传统在数字时代得到彰显。中华书局数字出版建设工作在古籍学术数字出版和大众文化数字出版双方向上都取得了令业界瞩目的成绩。

工欲善其事

必先利其器

不论是在古籍学术数字出版方向,还是在大众文化数字出版方向,中华书局都以自己独有的特色获得了读者的信任和市场的青睐。早在数字出版方兴未艾之初,中华书局就已率先成立了数字出版专业部门,明确其任务和职能,为出版社数字出版工作提供专业支持。据中华书局总编辑徐俊介绍,中华书局2002年即成立了古籍资源开发部,致力于全力打造“中华古籍语料库”项目。去年中华书局又正式成立了数字出版中心,中心由古籍资源开发部、平台运营部和网络信息部构成。目前,中华书局数字出版中心正在进行近年全部出版物排版数据的回收入库,这是中国出版集团公司统一建设的集团资源总库和出版社分库项目的一部分。既是中华书局数字出版标准统一、制度完善的过程,也是为集团下一步的集成性开发作好准备。

专业产品服务文化

谈到中华书局这样一家有着百年历史的古籍学术出版社在数字出版方面的建树,就不得不提到“中华古籍语料库”项目。对此徐俊十分自豪地告诉记者,“中华古籍语料库”2002年立项,并开始语料的采集、加工、校对。前六年集中进行语料采集加工,现在共完成约三亿字,包含了中华书局纸本古籍资源的主体部分,差错率在万分之一以下。期间,尝试开发建设了“资治通鉴知识分析系统”,可以对《资治通鉴》全文进行关键字检索,基于时间、人物、地名、事件等文本信息重组,并以图形方式展现分析成果。在“资治通鉴知识分析系统”的基础上开发了“中华基本史籍分系统”,该系统获得了“北京市文化创意产业发展专项资金”支持。在建的同类项目还有“商周铜器铭文”知识库等。目前中华书局古籍数字化的重点工作是“中华基本史籍知识库”建设,包括中国古代的最基本典籍、核心文献。该项目已经被列入新闻出版总署“十二五”国家重点电子出版物十个骨干工程。

中华书局目前正在筹措联合相关古籍出版社建成一个“中华学术著作数字出版平台”,以方便古籍整理和传统文史哲学科研究成果的发表、出版和使用。这是中华书局古籍学术专业数字出版规划建设的努力方向。

古籍数字出版不仅是各种古籍产品的数字化处理,与纸版古籍整理一样也需要规范,作为古籍整理出版专业社,中华书局一直参与古籍学术数字出版规范化的工作,并在该领域有所建树。

中华书局承担并完成的项目有“新闻出版用大字符集”项目、“古籍数字化用字规范”项目、“国家图书馆汉字规范处理项目”等。目前中华书局正在参与“中华字库”项目工程,工程将利用先进的信息技术手段,收集和汇总历代文献资源中出现过的汉字和少数民族文字,辨析源流衍变,确定每个字形的历史地位,建立汉字及少数民族文字的编码和主要字体字符库。完成后的“中华字库”预计可编码字符数在五十万左右,包括汉字古文字约十万、楷书汉字约三十万、各少数民族文字约十万。

不仅服务于古籍专业领域,中华书局数字出版建设在大众文化领域也有所建树。2011年7月中旬中华书局发布了一款适用于苹果手持设备系列的免费游戏“李小白”。

这款有着浓厚中国文化气息的国产游戏以中国地图为大背景,以中国最经典、最脍炙人口的诗词佳句、经典典故为主要内容,并穿插古代经典小游戏,如华容道、投壶、蹴鞠等。这款游戏尤其受到亚洲和欧美国家玩家的推崇,目前已有54个国家和地区的玩家下载,下载量达3.5万人次。有业内人士指出,出版社成功策划了一款游戏,而且还是以时下最火暴的新媒介为平台,以新媒介、新形式、新产品来推广出版社品牌,中华书局此举可谓是国内出版社数字出版的新探索,同时也开创了品牌营销的先河。

知难而进 义不容辞

中国古籍是中华民族历史发展和思想智慧集聚的珍贵文献,是传统文化的重要载体,而数字化正是延续文化传统的重要手段。但是在将这一新技术与古籍整理工作结合在一起的过程中,势必会有一些困难存在。徐俊坦率地表示:“数字出版的盈利模式、版权保护的问题是中华书局在运作数字出版项目时所遇到的困难。特别像古籍整理的版权保护是很复杂的问题,数字出版的传播简便、不可控因素多,即使有好产品,也经常是被盗版搞得入不敷出。”

正因如此,中华书局才要密切关注产业动向,投入主要力量做好语料资源准备工作,因为语料资源与大多数产品形态不同,它不会过期,所以价值优势更明显。

与目前流行的古籍文本的简单数字化不同,中华书局的古籍语料是以数十年原创性古籍整理为基础的,数字古籍中的校勘标点规范与纸质古籍是相同的,包括了校勘记、注释、专名线等基本元素,质量甚至高于纸质版本。徐俊认为目前市面上的古籍数字产品的质量水平大大低于纸质古籍已经达到的水平。古籍数字化,应该在原有纸质古籍整理成果之上结合数字技术特点,形成数字化古籍产品,而不是简单地进行古籍的数字化复制。这也是专业出版社与一些数字化古籍公司的不同之处。

技术革新带来传播方式、阅读方式的变化,如何实现专业数字产品的运营及盈利模式,以及在数字化时代下,中华书局怎样保持专业优势,纸书时代的学术品牌如何在数字时代保持影响力?这些都是中华书局一直在探索和思考的问题。

前路虽然有困难荆棘,但更多的是光明与希望。当百年老店以“百年再出发”的口号面对转型之路,利用数字出版新理念、新技术、新手段,为人类文明成果的集结提供更新颖的视角、更广阔的领域和更多元的形式之际,也正是中华书局又一次完成华丽转身之时。

 

 

 

中华书局重点数字出版工程
 
 
 
 

   “中华古籍语料库”项目

中华书局在2003年就开始了古籍数字化的工程。当时整个书局只有几台电脑,从零开始,经过六年的努力,建设了“中华古籍语料库”。该项目的核心是为古籍整理和资源开发提供一个强大的平台,方便检索、查询、阅读、使用古籍,把古籍的整理、编辑、出版、研究结合起来,形成一种新的工作模式。到目前为止,古籍语料库项目制作完成了三亿字高质量的(差错率在万分之一以下)古籍语料。

中华基本史籍知识库(“十二五”骨干工程)

“中华基本史籍知识库”项目是将整理本古籍进一步加工,以计算机辅助专家标注的方式,将基本文献文本与时间、人物、地域、职官、事件等知识元相结合,辅助读者阅读理解中华经典史籍。

   “商周铜器铭文”知识库

中华书局出版过一大批包括《殷周金文集成》《三代吉金文存》《金文编》等金文著录及研究图书,形成了丰富的商周铜器铭文出版资源,在海内外享有很高的声誉。目前,中华书局正着手将这些资源数字化,建立“商周铜器铭文”知识库系统,提供给读者一个阅读、检索、统计分析商周铜器铭文的工具。

   “新闻出版用汉字大字符集”项目

2003年起,中华书局承担组织新闻出版总署的“新闻出版用汉字大字符集”项目,全面地调查统计出版界的汉字使用情况,充分利用现代信息处理的手段,整理与标注汉字的各项属性与参数,建立相应的数据库。项目全部甄别收录现代大型辞书的所有字头,同时收录了各辞书所未收的出现在整理本古籍中的有新闻出版使用价值的汉字,尽可能详尽描述其属性,方便以后的软件开发。目前该项目已接近验收。

   “信息技术中文编码字符集汉字排序

   (笔画序和笔顺序)”项目

2006年,中华书局承担信息产业部电子工业化研究所“信息技术中文编码字符集汉字排序(笔画序和笔顺序)”项目,在现有中文编码字符集GB18030-2005/GB13000的基础上,制定相应的汉字字形排序标准,作为促进中文编码字符集应用的配套工具。这项标准的研制除涉及信息技术外,还涉及汉字字形的规范化及其他相关信息的研究。本规范是GB18030-2005/GB13000统一汉字字形排序标准内容之一,其数据内容包括:汉字字形、笔画数、笔顺,汉字的GB18030、GB13000代码,汉字来源(CJK)等。

“‘中华字库’工程立项研究”项目

“中华字库”工程是国家“十一五”、“十二五”规划中的重大文化产业推进项目,该项目是要将数千年的文字载体中所有出现过的汉字形体和少数民族文字形体收集和汇聚起来,在保持从各种实际文本中摘取出来的原形图像基础上,确定标准形体,添注各类属性,有序地分层级排列,建立字际间的相互联系,给予确定的码位,并按照出版及网络数字化需求,建立全部汉字及少数民族文字的编码和主要字体字符库。中华书局主持组织了国家“十一五文化发展纲要”中的示范性工程“中华字库”的项目论证工作。

中华基本史籍分析系统

中华书局“中华基本史籍分析系统”是把“二十四史”及《资治通鉴》为代表的中国基本史籍作深度加工,实现基于知识的内容检索,强化信息重组的能力,扩展语料库的应用,更好地为用户提供服务。

(C)2011 中华书局有限公司 版权所有 京ICP备05012931号

www.zhbc.com.cn  zhbc@zhbc.com.cn