您好, 访客   登录/注册

档案数字化扫描工作错情探析

来源:用户上传      作者:方彦 叶曦

  摘要:扫描是档案数字化过程的关键环节,看似简单、机械,却存在各种具体问题,直接影响档案数字化成果质量。论文借助鱼骨图分析法,从“人”“机”“料”“法”“环”五个方面对档案数字化扫描工作的错情进行统计、研究,并据此从人力资源、软硬件设施、工作环境建设等方面提出优化档案数字化扫描工作质量的针对性措施。
  关键词:档案数字化扫描 档案数字化 档案外包 档案信息资源开发
  扫描工作作为档案数字化工作的主体部分,直接决定了馆藏档案数字化成果质量。近年来,研究者从诸多角度探讨档案数字化工作,包括档案数字化外包项目管理[1]、档案数字化方案[2]、档案数字化质量控制[3]、档案数字化工作整体情况总结[4]等,但对于扫描这一具体工作尚缺乏较为深入的研究。
  从现有成果的验收情况来看,档案数字化扫描主要存在三大问题:一是“脏”,具体表现为图像存在污渍、颜色不均匀、不同页面的色差明显等;二是“乱”,具体表现为图像命名顺序与档案原件编页顺序不一致、重复扫描、遗漏扫描等;三是“残”,具体表现为档案幅面大小与原件不符、档案破损、折角等。在实际工作中,我们通常根据错情的严重程度进行分类管理。
  (一)“零容忍”的重大错误
  零容忍的重大错误主要指的是严重影响档案数字化利用的错误,根据成因又细分为四种:一是档案内容不完整,存在漏页、图像损坏等情况,导致档案无法利用;二是档案信息内容完整,但存在图像明显畸变、严重倾斜扭曲、扫描前处理不当等情况,导致可读性极差;三是扫描件与原件不符,存在图像错误、扫描顺序错误、原始档案与数字化副本图像色差过大等情况,导致利用效果差或存在误导利用者的可能;四是数字化扫描成果不符合相关标准要求,包括扫描技术参数设置错误、数据挂接错误等。
  (二)可控制的明显错误
  可控制的明显错误主要指对正常阅读使用影响不大,且可以通过补扫等方式进行查缺补漏的错误。在大多数情况下,此类错误可以通过后期处理进行纠正。例如,档案信息重复扫描、图像背景色与实际要求不符、图像方向不符合要求、图像裁切错误等。此外,此类错误还包括部分需要重新扫描的情况,例如,图像清晰度不够;因褶皱压字、透字、折角、混入异物等情况,轻微影响档案数字化副本阅读等。在档案数字化加工中,可控制的明显错误是检查过程中最常见的错误类型。
  (三)存疑义的轻微错误
  存疑义的轻微错误主要指档案数字化项目委托方和外包服务机构都无法明显判定的、存在争议的错误,以及在数字化加工标准中尚未明晰的问题。此类错误大多由档案原件情况复杂导致,占比较低。例如,对于“高龄”档案,前人未做妥善整理,无序混乱,如今难以考证,导致档案逻辑难以理清,整理困难;档案因老化、虫蛀出现粘连、破碎等情况,导致档案信息缺失等。此外,超出双方约定范围,但项目委托方判定需要修正的其他情况,也属于待商榷的轻微错误。
  本文借用5M因素分析法(鱼骨图),分别从人(Man)、机(Machinery)、料(Material)、法(Method)、环(Milieu)五个方面分析档案扫描工作出现错情的原因(见图1)。
  (一)“人”方面主要原因:经验缺失、职业倦怠
  档案馆工作人员不足且不够熟悉项目管理,在档案数字化合同履行、质量控制等诸多方面难免力有不逮。为此,部分单位建立了档案数字化监理模式,较好地弥补了委托方项目管理经验不足的问题,也不可避免地造成管理层级和经费支出的增加。同时,由于长时间从事高强度的档案扫描工作容易使工作人员产生职业倦怠,难以彻底实现专人专岗,而人员变更时工作交接不到位、不同工作人员专业素质与熟练程度存在差异等,都是增加错情风险的重要原因。
  (二)“机”方面主要原因:维护不佳、使用不当
  在硬件方面,扫描设备“超龄服役”、未定时或及时清灰是导致图像模糊失真、脏污、内容不完整等错情的主要原因。此外,硬件设备选择不当也会对扫描造成影响。例如,对于本身具有背景色的档案(包括使用有色纸张承载的档案、老化泛黄的档案等),利用平板扫描仪进行扫描可以最大程度保持档案原貌,而用高速扫描仪进行双面扫描时,由于正反面M光情况不同、不同页面进光情况不同等原因,容易出现同一张档案正反面颜色不同、同一份档案不同页面间颜色不同等问题。
  在软件方面,预设参数设置出现差错,也会导致整批次档案数字化图像质量不佳。例如,对页面中带有红头、印章、彩色插图等元素的档案进行扫描时,没有采用彩色模式;对文字偏小、密集、清晰度较差的档案,预设的分辨率偏低。此外,图像处理系统存在的短板也是产生错情的重要原因。
  (三)“料”方面主要原因:材质有别、内容多元
  档案来源复杂,反映在载体上,主要表现为:一是档案载体类型不同,虽同为纸质档案,但文书、照片、工程等档案在纸张材质、规格大小等方面有所差异,扫描要求和注意事项也不同;二是档案存放形式不同,如幅面较大的,以折叠、筒子页、册页等形式存放的档案,扫描时容易出现图像扭曲、顺序混乱等问题;三是档案载体老化破损程度不同。同时,档案内容呈现风格多样,例如,民国时期形成的档案多为手写,存在不少异体字、繁体字;各地特色档案中多见方言俚语,内容的表达方式与社会规范表达迥异,扫描工作人员缺乏相应的文化背景容易导致扫描顺序混乱。
  (四)“法”方面主要原因:压缩成本、风险难控
  目前,各地档案数字化工作普遍采取外包模式开展。但档案数字化外包服务机构是以盈利为目的成立的组织,为了实现更高的利润,必然努力控制成本。从档案数字化工作的具体内容来看,压缩外包成本主要有三个方向:一是提高效率,减少时间成本;二是充分利用人力资源,减少薪酬支出;三是发挥设备的最大价值,减少设备相关支出。公司的性质决定了档案数字化扫描工作的错情难以控制且不可避免。

nlc202209051854



转载注明来源:https://www.xzbu.com/4/view-15439127.htm

相关文章