您好, 访客   登录/注册

数据挖掘技术在图书推荐系统中的应用

来源:用户上传      作者:

  摘要:随着网络信息技术的快速发展,高校图书馆传统管理模式和系统受到了巨大的冲击,现阶段,结合大数据和云计算等技术,提高图书馆系统管理功能显得尤为重要。目前,读者对于图书馆要求不仅仅限于传统借还服务方式上,还包括网络检索、快速查阅、个性化服务等多方面。图书馆系统建设中要充分利用现代网络及信息技术,促进推荐系统的逐步完善,加强信息审核,结合读者需求定期推荐,进而提高图书服务水平。本文首先对数据挖掘的概念进行了分析,指出了图书馆系统应用数据挖掘技术的优势,对具体算法、数据处理和关键技术改进提出了有效的建议和对策。
  关键词:数据挖掘技术;图书馆;推荐系统
  中图分类号:TP311      文献标识码:A
  文章编号:1009-3044(2019)13-0001-02
  现代网络技术的发展,使图书馆发生了翻天覆地的变革,最初的纸质图书馆到目前的自动化、智能化图书馆,网络虚拟技术在图书馆系统中的应用较为普遍。目前,图书馆系统中服务项目逐渐增加,读者图书服务水平逐渐提高,但是针对性的个性化的服务项目还有待挖掘和完善。我国高校建设也十分重视图书馆的建设和发展,推进数字化校园建设。数据挖掘技术作为信息技术中的重要组成部分,在图书馆推荐系统中应用该类技术,可以实现为读者提供个性化服务,创新管理形式,促进系统功能优化,进而促进图书馆建设的日趋完善。
  1 数据挖掘的概念
  数据挖掘概念最早是在加拿大被提出,1995年加拿大蒙特利尔第一届知识发现和数据挖掘国际会议上国外学者Usaama提出,后期在美国底特律举行的学术会议上,对人工智能进行了系统的分析。从20世纪依赖,数据技术逐步万汉,数据库系统建设逐步更新,数据信息整合和挖掘的水平显著提高,很多有价值的信息被快速提取出来。由于海量信息处理的难度加大,数据挖掘和筛选技术应运而生,数据挖掘技术逐渐被人们关注和认可。数据挖掘技术的发展是与计算机技术革新、数据库建设发展和网络信息技术发展息息相关的。知识发现也是一个重要的相关概念,是指在海量信息中辨别出有价值的知识,这是对数据和信息的高级处理过程。数据挖掘技术是知识发现的核心技术,是从数据库中提取特定规律的数据和信息,作为参考,进而提炼出用户所需的最终信息和资源。
  2 图书馆服务系统中应用数据挖掘技术的优势
  数据挖掘技术对于人类生活和工作的影响是十分突出的,这是一种高效便捷的数据整合和筛选技术,集成了多个领域的知识系统,目前正逐步走向成熟,将数据挖掘技术应用于高校图书馆智能体系中,十分必要。
  2.1 数据挖掘技术的优势
  2.1.1 信息需求的促进
  随着网络信息技术的快速发展,人们对于信息的需求量逐渐增加,使用层次加深,在众多海量信息和数据中,如何将复杂的数据转换成有价值的资源和信息是十分必要的。在图书馆系统中庞大的数据和信息资源难以计算和筛选,必须采用一种先进的技术,实现数据的整合和处理,进而筛选出有价值的资源,为读者提供针对性的图书服务。
  2.1.2 争取潜在读者的需求
  图书馆管理系统中,很多读者的访问数据都存在这里,如何将这些数据和信息进行整合至关重要,数据挖掘技术就是这样一种技术,可以对数据进行分类处理,从而确定图书馆中那类书籍借阅量较大,读者感兴趣的书籍都是哪些类别。数据挖掘技术可以将一些隐藏的信息挖掘出来,将智能整合后的资源和信息推送给读者,进而更好地为读者服务。
  2.1.3 提高获取信息和数据的速度
  图书馆系统要定期更新,在传统系统使用中,对于数据和信息的处理和计算速度较慢,数据挖掘技术可以有效地避免这些弊端,计算速度极快,信息筛选能力强,使用这类技术可以显著提高图书馆系统的各项功能。数据挖掘技术的应用可以提高图书馆获取资源的速率,提升读者应用体验,提高系统反应能力。
  2.2 数据挖掘技术的可行性分析
  我国高校图书馆积累了很多的经验,数据挖掘技术在实际应用中是具有可行性的。首先,我国高校现代化建设水平逐步提高,为了发挥图书馆的价值,要充分利用信息资源,挖掘数据和信息中有价值的资源,提高数据的利用率,从而提高图书馆服务质量。图书馆哟满足读者的需求,要提供个性化、针对性的服务,这也是图书推荐系统的主要功能,这就需要对现有数据和信息进行挖掘和处理,对数据进行分析,加强信息管理,组织各类数据,为图书馆的知识管理提供依据。其次,数据挖掘技术逐渐成熟也为图书馆推荐系统的逐步完善提供了可能。数据挖掘技术目前应用多种领域,包括工业生产、医疗机构、图书管理系统等等,数据挖掘技术逐步的发展和完善,运作方式方法日趋成熟,管理方便,技术逐步革新,图书馆推荐系统应用数据挖掘技术十分可行。另外,图书馆信息化建设水平逐渐提高,数据库建设较为完善,数据库系统分析能力不断增强,图像数据库、对象数据库、智能数据库逐步建设,这也为数据挖掘技术的应用提供了平台。
  3 数据挖掘算法
  3.1 分类分析
  对于数据分类的分析是比较基础的,要对数据集进行训练,要采取科学的算法进行计算,数据库确定后要进行初步分析,做好数据类别的基本分类,要做好类别描述,要根据数据性质进行建立模型,之后要利用原有信息和数据进行研究,加强信息和数据预测。
  3.2 聚類分析
  聚类分析是指将数据和信息分为若干类别,主要根据分析对象的特征找出一定的规律,进而对同一类型数据进行分析,数据分布模式较为特殊,对数据之间的关系进行分析。
  3.3 关联分析
  数据挖掘技术中的算法还有关联分析,这也是基础算法之一,主要是针对不同的数据建立一种联系,可以是因果联系、时序联系或简单联系等等,进而实现各类数据的瞬间提取和筛选。   3.4 预测分析
  对各类数据和信息进行分析,找出相关的规律,建立相应的模型,对其未来变化进行预测。
  3.5 偏差分析
  图书馆数据库中的数据有的存在一些异常的特征,及时发现异常有助于对数据和信息机进行纠错,偏差分析就是有效预防误差的一种数据挖掘算法,进而观察数据和信息是否合理,为图书馆服务提供科学的服务项目。
  4 系统数据处理
  4.1 空白数据处理
  图书馆系统数据挖掘过程中要做好空白数据的处理,要保证数据挖掘的准确性。数据挖掘的首要条件就是真实和有效,如果数据表出现空值,技术人员要结合数据之间的关系,将空值补充完整,实在难以填充的要将该条数据删除。例如每本书有一个唯一的索书号,这是数据挖掘中的是必需字段,在这类字段中不能出现空值,要根据书名查找数据库将索引号补全。
  4.2 重复数据处理
  在图书推荐系统中难免会存在一些重复记录,这些重复记录会应影响数据和信息的筛选,例如由于特殊原因,读者在一天之内多次借还相同图书,或者图书管理员失误导致的重复记录,这对于数据挖掘都会产生影响,因此,数据挖掘时要做好重复数据的处理。
  4.3 字段选取
  数据挖掘中会选取一些字段进行分析,在选择字段时要保证其科学性,例如借书日期、操作员、操作类型、部门代码等都要做好处理。
  5 推荐系统的功能分析
  5.1 热门书籍推荐
  在实际图书馆推荐系统英勇值,有很多读者选择不登录系统直接查找图书,图书馆可以根据读者的实际需求给读者一些推荐,推荐一些热门的书籍。登录推荐系统的读者,系统中留存其浏览和查阅的记录,可以通过数据挖掘和整合确定读者感兴趣的书籍。图书馆系统根据读者的专业类别和兴趣爱好制定推荐列表。
  5.2 根据读者借阅史推荐
  读者在登录和借阅图书后,图书馆系统中会留存读者的各类信息和数据,尤其是借阅过的图书,图书推荐系统会根据读者的借阅史推荐给读者适合的书籍。
  5.3 浏览查阅推荐
  推荐系统要根据读者查阅的图书推荐相近的书籍和刊物等等,这些功能就可以通过筛选图书索引号挖掘来实现。
  5.4 新书籍推荐
  图书馆在引进新书籍后,要在系统中发布公告,使读者了解有哪些新书籍可以选择。
  6 关键技术研究与改进
  在图书馆个性推荐系统中,要对读者的兴趣爱好信息进行整合,要准确掌握不同读者的阅读兴趣,捕捉读者兴趣变化,进而提高针对性的、个性化的图书推送服务。读者使用图书馆推荐系统时间延长,读者的兴趣容易受多种因素的影响,如环境、人物等等,系统获取相关资源和数据就存在一定的难度。因此,图书馆推荐系统要将读者兴趣变化因素考虑在内。很多时候读者的兴趣是跟随时间变化的,也和读者的个人经历和阅历有关,传统协同过滤推荐算法主要是在计算相似度时采用余弦相似度或皮尔逊系数等方法,如果还使用历史数据,会导致推荐的准确度降低。
  目前解决用户兴趣变化的协同过滤推荐问题可以归纳为三类方法:评分加权法、评分选择法和基于其他领域知识方法。评分加权是在用户的项目-评分矩阵上添加一个权重,用户的最近借阅图书的评分必定会比系统初期评分的权重大。該权重的调整通过在计算项目相似度和用户预测评分的过程中体现。评分加权法具有普遍适用性,并且实现简单、能够较为准确的区分用户在不同时间评分的重要性。其中,评分加权法中添加描述时间权重的方法主要有三种:模拟遗忘曲线、运用线性函数建模和运用非线性函数建模。其中,基于遗忘曲线的研究受到了学者们的广泛青睐,本文采用模拟遗忘曲线的方法来添加权重。
  在图书馆推荐系统中主要采用的协同过滤推荐算法主要是基于时间变化权重方法,同时还要综合考量读者借阅频率的因素,可以添加时间和借阅频率权重,进而充分发挥数据和信息的作用,实现个性化图书推荐。推荐算法最好要以艾宾浩斯遗忘曲线为基础,做好读者归还图书评分和借阅次数评分。通过对艾宾浩斯记忆遗忘曲线的分析,要重视外部因素对读者兴趣的影响,进而对数据和信息进行科学分析,得出科学的结论,为读者提供最适合的图书。
  7 结语
  总之,图书馆推荐系统中使用数据挖掘技术有助于提高图书馆书籍的利用效率,数据挖掘技术是网络信息技术的一种,在图书馆推荐系统中应用这种技术可以通过对以往数据和信息的分析,为读者提供个性化的推荐服务,有助于调整图书馆管理方式和馆藏布局,有利于为图书馆决策提供科学依据。
  参考文献:
  [1] 蔡琬琰.基于数据挖掘的高校图书馆网站个性化推荐系统[J].情报探索,2011(3):88-90.
  [2] 张肖回.基于数据仓库技术的图书馆业务数据可视化监控平台——以厦门图书馆为例[J].现代情报,2013(04):150-153+158.
  [3] 聂飞霞.基于数据挖掘技术的图书馆个性化推荐系统研究[D].西安:西北大学,2013.
  [4] 赵炜.数据挖掘在读者个性化信息服务系统中的研究[D].湖北:长江大学,2016.
  【通联编辑:李雅琪】
转载注明来源:https://www.xzbu.com/8/view-14910042.htm