您好, 访客   登录/注册

新技术环境下大数据在图书馆服务中的应用研究

来源:用户上传      作者:饶丽琼

  摘要:在大数据时代,图书馆服务创新是新技术环境中从传统知识服务向大数据知识过渡的一部分。本文论述了“大数据”技术在图书馆的应用,以及如何深化图书馆信息服务的思路和建议。
  关键词:新技术环境 大数据 知识服务 图书馆服务
  随着网络和数据库技术的发展,大型数据存储库中数据收集和存储量的迅速增加需要理解和处理。目前,这些数据是依据常规数据分析技术分析的,但目前PB层面大量数据积累、信息稀缺的局面显然不能满足日益增长的社会需求。为了更好地了解和处理这些丰富的数据,并确定指导决策的潜在规则和链接,成为读者改进学校发展的知识库,除了传统的读者服务,只要是方便借阅者的都是研究的方向。
  一、高校图书馆服务对数据挖掘的需求
  目前,高校图书馆注重借阅者的需求,实施图书馆服务,满足读者的真实需求,实现尽可能低的教学、科研和扎实的支持。高校图书馆根据读者对图书馆服务过程的需要,首先通过多种方式收集读者信息数据,实现读者的有效识别。其次大学图书馆根据信息数据对读者进行排名,以确保完全反映不同用户组之间的差异。第三,大学图书馆分析每个用户组,并揭示每个用户组的特点和需求。最后,高校图书馆结合读者需求,合理利用大数据资源,针对读者提供电子信息供给和目标服务的特点。作为图书馆书籍采购的一部分,用于形成记录业绩信息和最终数据的服务流程,以及上述用户标识、用户分类和其他链接。[ 1 ]
  与流程整理结合使用时,每个流程都需要大量数据需求分析才能开始,许多有价值的分析结果都隐藏在需要专家和相关技术才能实现此流程的数据中。然而,结合高校图书馆目前的人员配置结构,很难有条不紊地完成大部分信息数据分析任务。因此,您需要找到一种有效的方法,以便对这些信息数据进行有效的分析。
  二、数据挖掘技术的背景与定义
  1.数据挖掘的背景
  (1)数据挖掘的商业背景。数据挖掘主要是在业务环境中收集大量数据,并且需要知识挖掘。在业务中,数据挖掘用作四种工具:数据挖掘作为搜索工具,数据挖掘作为过程控制,数据挖掘作为营销工具,数据挖掘作为获取知识的渠道。
  (2)数据挖掘的社会背景。如果没有数据挖掘的结果,一个人的想象力可能并不完全正确。由于客户的行为与社会环境有关,因此数据挖掘本身受社会环境的影响。
  2.数据挖掘的定义
  根据相关研究表明:数据挖掘是一个新兴、交叉学科领域,数据挖掘即为从大量的、不完全的,有噪声的、随机的数据中提取含在其中的、人们事先不知道的、有用的信息和知识的过程。
  三、大数据时代图书馆面临的机遇和挑战
  1.扩大图书馆的服务内容和提高服务质量需要大数据提供支持
  目前图书馆行业竞争的关键:图书馆资源、使用空间、大数据所有权、分析各种重要复杂数据的能力、预测和价值发展,图书馆未来的发展战略也基于大数据分析和预测。
  2.大数据将是图书馆的主要资源与核心资产
  随着人们对大数据技术的理解不断提高,大数据分析技术变得更加成熟,使大家对大数据的价值进行了更深入地探索。
  3.大数据时代为图书馆带来了发展机遇和挑战
  就目前情况来看,图书馆不仅可以使用结构化数据来理解和控制现有读者接受的服务类型,还可以通过巨大的非结构化或半结构化数据找到更好的服务模型,以应对未来的竞争挑战,并且你必须预测和分析未来。
  四、大数据时代图书馆服务创新和发展方向
  1.关注和重视大量的图书馆用户的数据和信息
  在大数据时代,除了文献数据信息外,其他数据挖掘和利用也是图书馆产业竞争力的重要因素,增加信息资源的收集是大数据时代图书馆资源建设的内容之一。大数据库时代需要大量数据,包括当前正在构建的文献和网络资源,以及无法运行或当前无法运行的非结构数据。
  2.着力提升图书馆服务的智能化程度
  现代图书馆服务需要高技术要求和先进的智能服务。首先,图书馆需要使用一定程度的智能技术来自动执行复s的高级数据收集和处理任务,以节省人力和物力资源来解决手动任务。第二个是查看读者的服务内容。智能化手段水平也为图书馆智能决策、改进、社会信息、生活数据等服务工作提供了必要资料的上下文和信息。[ 2 ]第三,智能图书馆服务水平不仅影响知识从单一学科向多学科的传播,而且影响知识的变革,成为知识发现、挖掘和知识组织的基础。
  3.深度的参考咨询服务
  传统的参考咨询服务主要是利用现有的图书馆参考图书和研究工具书。室外和自建数据库由具有一定专业知识和对大数据时代研究工具熟悉的专业知识的专用参考图书馆员组织,这可以减少咨询图书馆员资源的时间,扩大咨询馆员对资源的获取,大幅度地提高读者满意度,提高阅读者咨询的效率。[ 3 ]
  4.充分利用大量的复杂的数据分析技术与工具
  图书馆将来对工具应用的需求将更为迫切,这也突出了对提高图书馆技术应用水平的更高要求。
  5.数据挖掘相关技术
  (1)频繁模式挖掘。频繁模式提取是事务数据库中不同货物之间的连接规则,即数据中频繁发生的模式,包括项目子集、设备和技巧。
  (2)聚类。聚类使用多种特征组合将样本分类为组,将个人组分类为组或聚类,特别是基于相似性。因为同一群集中的对象之间的高度相似性以及不同群集中的对象之间具有较大差异。
  (3)时间序列分析。时间序列分析是时间序列中发生的一系列事件,研究人员按每个固定间隔的顺序记录事件结果。时间序列数据的最大特征是,每个事件在数据后立即以相同的间隔记录。按时间顺序排列的数据,如图书馆读者的年龄分布、自由阅读时间的波动、每月进出图书馆的人流量和借阅图书的人流量在每个时间段的分布情况。[4]

nlc202206131240



转载注明来源:https://www.xzbu.com/1/view-15433349.htm

相关文章