上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人
1.3.3 数字化加工的通用格式与规范
(1)数字化加工通用格式
目前,在各种电子终端上显示阅读的电子书,是经过非结构化数据加工的各种格式电子文档。其中,最有代表性的格式有两种:一种是可移植文档格式(Portable Document Format),简称PDF格式;另一种是电子书格式(Electronic Publication),简称ePub格式。ePub是目前国际上兴起的能够跨越互联网平台和移动通信平台的格式。另外,国内一些数字出版公司也开发应用了各种电子书阅读格式,如同方CAJ、方正CEB、超星PDG、书生SEP等。目前,中国新闻出版信息化技术委员会正在进行数字出版标准体系研究,其中,涉及数字出版的十多个细分领域的标准,包括制定电子书数字出版标准。可以预见,电子书数字出版标准会出现逐渐采用通用格式的趋向。
(2)数字化加工规范作用
目前国内很多数据加工单位制作PDF格式文件,使用的参数不统一,造成的影响是:①其成品对后期PDF数据的反解和格式转换软件的开发带来很大不便;②有些重要的参数也被忽略,如“字体嵌入”,导致PDF格式在转换及文本分析时产生乱码。为了避免后续应用带来的制约,需要在数字化加工中制定PDF加工规范,用规范引导和保证加工成品的各种重用需求。