近期大量仿制我们网站案例,请客户认准博士论文网唯一官方地址:www.boshilunwen.com !
您现在所在的位置:代写职称论文 > 职称论文 >

对期刊数字化加工方式的比较分析

来源: 博士论文网 时间: 2017-11-28 13:45 阅读: 次 【加入收藏

  一、 引言
  
  随着计算机、手机、移动终端等各种设备的普及,人们获取和利用信息的方式发生了很大改变,由原来以纸媒体为主的信息获取方式,逐渐转变为利用电脑和网络获取信息,人们获取和利用信息方式的改变以及数字化技术的迅猛发展,给传统出版行业带来巨大的挑战,并催生了数字出版行业。为了生存,传统出版业都在积极向数字出版转型,而文献的数字化加工是数字出版行业最基础的环节,本文以期刊这种文献为对象,研究其数字化加工的特点。
  
  二、 期刊数字化概述
  
  (一) 定义
  
  目前,研究者对期刊数字化概念的研究很多,但尚无明确定义。本文认为,期刊数字化是利用现代信息技术,将纸介质期刊或电子介质期刊进行再加工,使其转换成为符合特定要求的数字化信息,并存储于光、磁等介质上,通过网络技术、数据库技术、检索技术等实现信息的传递、共享、检索,为广大读者提供信息服务,满足读者的阅读和使用需求。这里的再加工,并不是简单地把传统的纸介质期刊转换为电子版形式或者把电子介质期刊转换格式,而是包含了对期刊内容的深度发掘、分析、提取、重组、标引、利用等等操作,使期刊内涵更加丰富,更能满足读者的需求,方便读者的使用,增加期刊的附加价值。
  
  (二) 发展及分类
  
  有学者研究,国内数字化期刊形成于万方公司的期刊数字化工程,这一工程以现有的印刷型期刊为资源,对其进行数字化集成整合,并使其最终上网。由此可见,数字化期刊在产生之初是与印刷型期刊相对而言的,是狭义的,是印刷型期刊的数字化版。因而可以说,国内最早的期刊数字化是专门针对纸介质期刊进行的数字化处理,它是期刊数字化最早的方式和起源,本文中称为纸介质期刊数字化(即传统加工线)。随着时代的发展、技术的进步、数字化出版的高速发展,期刊数字化的方式在不断发展和进步,目前形成了利用期刊电子版进行再加工的期刊数字化方式(即电子加工线)。本文主要针对这两种不同的期刊数字化方式进行比较研究,说明其各自的特点、优劣势。
  
  (三) 期刊数字化的加工方式及流程
  
  1. 纸介质期刊数字化--传统线加工流程
  
  纸介质期刊的数字化加工起源较早,发展时间较长,流程也比较成熟,它的主要流程如下:
  
  期刊数字化的传统加工流程,首先需要将已经出版的纸介质期刊拆分成单页的、按原顺序排列的单页纸张,再使用高扫仪进行扫描,将期刊的图片录入电脑;其次,通过OCR识别,将图片格式转换为文本格式;再次,通过固定的程序辅助人工,对OCR识别的期刊文本进行校对,修正文章顺序、乱码、错字、显示等错误,然后对校对无误的内容进行元数据的提取、入库,对提取完的内容进行再次的检查和修改;最后,用特定的软件对内容进行特定处理,即可形成可上网的电子化、数字化期刊。
  
  2. 纯电子版期刊数字化--电子线加工流程
  
  期刊数字化的电子线加工流程,首先是对各种不同格式的电子版文件进行转换,统一成pdf格式;其次,对转换完的pdf文档进行去乱码操作,修复文档中的乱码,剔除乱码比例过大且无法修复的文档;再次,对内容进行元数据的提取,入库;最后,对内容进行质量检查、修改错误,将正确的内容入库,即可形成电子化、数字化期刊。
  
  三、 优劣比较
  
  期刊数字化的传统线和电子线加工方式,其对象不同、发展时间不同,各有其优缺点。
  
  1. 适用范围
  
  传统线加工适用于已经出版的纸介质期刊及历史期刊数据的回溯;电子线加工适用于可以提供排版文件的纸介质期刊(目前可使用的排版文件类型有限:CDR、INDD、PDF为主流加工文件,其他如大样可以处理90%左右,PS文件可处理60%左右,飞腾文件可处理20%-30%左右,其他格式暂时不可处理)和纯电子期刊。由此可见,电子线加工虽然理论上可以适用于有排版文件的所有纸介质期刊,即理论上可以替代纸介质期刊现刊的传统线加工,但是由于目前的技术限制,实质上可加工的格式有限,可以加工的纸介质期刊的数量也受到了限制,因此相对于传统线加工,电子线加工的适用范围相对较窄。
  
  2. 成本
  
  期刊数字化加工的主要成本是设备、人工、软件和耗材等几个方面;传统线加工需要对应各种软件、期刊拆分设备、高扫仪器、计算机及各种耗材等等,而电子线加工仅需要各种软件、计算机即可。由此可见,相对于传统线加工,电子线加工的成本相对较低,而就人工成本而言,电子线相对于传统线省去了很多流程,减少了人工用量,人工成本相对降低了。
  
  3. 加工时间
  
  由于电子线加工省去了对纸介质期刊的拆分、扫描、识别、修正等工序,直接使用电子版进行加工处理,因此在加工时间上,平均比传统线缩短1周左右的时间。
  
  4. 时效
  
  传统线加工的对象是纸介质期刊,只能在期刊正式出版后才可加工,上网时间一般滞后于期刊上市时间,读者都是先看到印刷版期刊的内容,然后才能阅读或搜索到期刊数字化的内容;而电子线加工的对象是电子介质期刊,只要在期刊排版工作完成以后使用排版文件即可加工,可与印刷版期刊同步上市甚至更早,读者可因此而较早地查询,而后阅读、购买印刷出版的期刊。
  
  5. 效果
  
  传统线加工需要从纸介质版到电子版的转化,即使过程中使用高分辨率的扫描设备,其质量也次于电子线加工的期刊。电子版期刊直接进行数字化加工效果更好,清晰度更高,但也造成了存储空间的增大,为数据的保存和镜像的使用带来不便。
  
  6. 质量
  
  传统线加工使用的是已经出版的期刊,可以保证版面、格式、内容与期刊高度一致,而电子线加工使用的是排版文件,由于各种原因,可能会导致加工文件与期刊出版的误差,在版面、格式、内容等方面都可能出现错误和不一致的情况,如单篇文章的增删、缺少图片、元数据不全等等。所以,在目前的技术和资源环境下,传统线加工的质量要比电子线加工的质量有保证。
  
  7. 检索深度
  
  电子线加工可以实现真正意义上的全文检索,它是基于纯电子版加工的,检索的内容局限在元数据上,可以实现对正文内容的全面检索,而传统线加工的期刊仅停留在关键词的检索层面。
  
  通过比较分析可以看出,期刊数字化的传统线加工和电子线加工各有优缺点。目前的情况,电子线加工刚起步,在技术手段和资源匹配方面还存在很多的不足和有待发展的地方,由于数字出版业的高速发展、电子版期刊的发展和完善,以及技术研发的不断跟进、采集内容的不断规范,期刊的电子线加工将会成为期刊电子化的主流加工方式,而目前占主流加工方式的传统线加工,由于其独特的使用范围也不会消失,只会退居二线,成为期刊加工的辅助手段,主要用于历史期刊的回溯、电子线加工的查遗补缺。
  
  结语
  
  随着数字出版业的发展,期刊作为主要的出版物之一也在逐步向数字化、电子化发展,在这个过程中,除了电子期刊、手机APP期刊等,期刊数字化将在相当长的一段时间内占据主要地位,而期刊数字化的方式更有待进一步的研究、改善和发展,以提高期刊数字化的质量、时效、深度和广度。

  参考文献:
 
  [1]郎春艳.电子期刊、数字化期刊与网络期刊概念辨异[J].新世纪图书馆,2005,(2):42-44
  [2]曾建勋、程少锋.论期刊的数字化工程[J].情报学报,2000,19(5):510-513
  [3]化柏林、张新民.从检索技术的实现方式看三大全文数据库的发展[J].图书情报工作,2007,51(10):13-16
  [4] 卢向东.文献数字化理论研究探微[J].四川图书馆学报,2004,(4):2-5
  [5] 王璐、祁兴华、虞舜等.论中医文献数字化研究[J].中国中医药信息杂志,2015,(10):1-3