您好, 访客   登录/注册

数据关联技术在数字图书馆知识发现服务中的应用

来源:用户上传      作者:李清

关键词:关联聚合;关联分析;数字图书馆;知识发现服务

DOI: 10.3969/j.issn.2095-5707.2021.05.007 开放科学(资源服务)标识码(OSID):

LI Qing

Abstract: Association aggregation and association analysis can improve the communication and utilization efficiency of digital resources, optimize the use environment of digital resources, and provide new technical support for the knowledge discovery services of digital libraries. Knowledge discovery services of digital libraries based on association aggregation and association analysis should follow the principles of integrity and coordination, scientificity and standardization, priority and sustainability. The knowledge discovery service system is constructed from the service layer, knowledge discovery layer, and resource layer, and knowledge discovery services of digital libraries can be realized by planning the scope of data set, describing metadata at different levels, and establishing a three-dimensional knowledge point system.

[1]。如今,关联聚合与关联分析技术被广泛应用于各行各业,包括数字图书馆领域。在网络信息技术环境下,需要应用关联聚合与关联分析技术使数据间形成稳定有序关系,以实现数字图书馆知识发现服务。伴随大数据时代的到来,数字图书馆信息资源不断增多,如果缺乏关联聚合与关联分析能力,海量数据必然导致图书馆知识发现服务杂乱无章,给

第一作者:李清,E-mail: nongyue6832911722@163.com

用户知识获取带来较大的障碍。因此,将关联聚合与关联分析这门交叉领域的新技术应用于数字图书馆知识发现服务过程中是必要的,既可以提高数字图书馆资源的利用效率,也能够强化数据间的异构关联,从而为用户提供精准的知识服务。

1 数字图书馆知识发现服务应用数据关联技术必要性

关联聚合与关联分析概念的提出,在很大程度上解决了数字图书馆服务过程中出现的信息孤岛的问题,能够有效地将异构数据聚集整合起来,实现数据资源跨领域、跨学科的互通共享。因此,数字图书馆知识发现服务应用关联聚合与关联分析技术是十分必要的。

1.1 提高数字资源的沟通效率

在传统的数字图书馆资源构建过程中,知识资源是零散分布的,缺乏内在的逻辑和规律,用户在检索资源时常常遇到瓶颈,这种孤立的资源存储方式使资源间缺少必要的联系和对话,加大了图书馆知识服务的难度与成本。充分应用关联聚合与关联分析技术,能够将分散的知识联系起来,挖掘数据资源之间的规律,为用户提供知识发现与访问的通道,由此降低用户知识发现的难度,提高数字资源的获取与使用效率,提升数字图书馆知识发现服务水平。

1.2 优化数字资源使用环境

随着网络环境的普及和信息技术的发展,数字资源获取的途径不断增加,用户可以通过各种渠道获取目标信息,这就导致数字图书馆信息资源呈现爆炸式增长的趋势。随之而来的是数字资源使用环境与知识发现操作越来越复杂,用户在获取资源服务时需要自己去伪存真,不断更换关键词进行检索,耗费了大量的时间与精力。应用关联聚合与关联分析技术,有利于对数字图书馆资源进行整合,进一步统一数字资源检索系统,优化数字资源使用环境,为用户提供优质的网络依托平台。

1.3 提高数字资源利用效率

应用关联聚合与关联分析的数字图书馆知识发现服务可以打破数字资源之间的异构壁垒,缓解知识孤岛困境,从而有效提升其服务质量和服务效率。数字资源得到充分的挖掘和关联,能够形成有机整体,便于用户的知识发现操作。可以说,强关联的数字资源是提高数字资源利用效率的基础,也是提高数字图书馆技术人员和知识发现服务人员工作效率的前提。

总之,在数字化技术普及的环境下,优化数字图书馆知识发现服务,关联聚合与关联分析技术必不可少。

2 数字图书馆知识发现服务原则

笔者认为,在实际操作过程中,需要遵循一定的原则,以保证强关联技术与数字图书馆工作的适配性,更好地促进图书馆资源整合和知识发现服务。

2.1 整体性与协调性

整体性与协调性原则强调的是数字图书馆既要完整全面地获取相关数字资源和知识内容,还要保障图书馆资源结构分布均衡。具体而言,数字图书馆知识发现服务旨在满足用户的资源需求,那么完整的资源储备必然是知识发现与关联聚合分析技术应用的前提基础,图书馆尤其要重视数据资源的内在联系,确保关联聚合后的资源能够覆盖相关学科或领域的内部功能,满足用户的需要。协调性原则更倾向于资源构建与馆员工作方面,从资源构建来看,注重分配均衡,不仅要涵盖文本资源,还要充实图片、音频、视频等知识资源格式,以便为关联聚合与关联分析技术的应用提供更多可能。此外,从馆员工作方面来看,图书馆在对数字资源进行整理、保存和共享过程中,各部门工作人员要统筹协调,保持步调协调一致,这样可以使用户服务的各环节畅通无阻,充分发挥数字图书馆知识发现服务的优势和特色。

2.2 科学性与规范性

数字图书馆知识发现服务的科学性与规范性是指数字图书馆在对知识资源进行关联聚合与关联分析的数字化技术手段处理过程中,无论是对方法的选取,还是对处理对象范围的划分,都不能是随机拼凑的,需要经过严谨的科学论证,只有遵循科学的强关联计算过程,才能保证结果的真实有效。与此同时,关联聚合与关联分析技术的应用也必须要符合规范,要充分考虑数字知识资源自身特征和学科领域的特殊性,采用规范的标准和技术手段对资源进行合理加工,形成科学性与规范性兼备的数字图书馆知识资源运作体系,为用户提供有效、完善的知识发现服务。

2.3 优先性与可持续性

数字图书馆知识发现服务要遵循优先性与可持续性原则。优先性原则是指图书馆在进行数字资源聚合与关联的过程中,要分清主次,抓住主要矛盾,对数字资源的价值高低或重要程度等级进行排序。一般来说,数字图书馆要优先考虑馆藏特色资源、优势资源、稀缺性资源等,充分保障这类知识资源的整合与分析,以保障数字图书馆知识发现服务优势,提升核心竞争力。可持续性原则是指數字图书馆在保证优先等级顺序的前提下,还要落实图书馆资源建设从重点到一般、从局部到整体的辐射;知识关联和聚合也要秉承可持续发展原则,保持及时更新,以满足用户需求为终极服务宗旨,根据用户需求持续调整,确保数字图书馆知识发现服务及时有效。

3 数字图书馆知识发现服务构建

知识发现服务是拓展与完善数字图书馆工作职能的重要措施,应用关联聚合与关联分析的知识发现服务能够充分发挥集成资源、集成服务的优势,最大限度地满足数字资源的共享与交流,降低用户知识发现的成本。依据关联聚合与关联分析技术,笔者从服务层、知识发现层与资源层3个层面进行数字图书馆知识发现服务构建。

3.1 服务层

服务层包括集成检索系统、数字参考咨询、个性化推送服务与知识发现服务4项内容,这是面向用户最主要的窗口,在这个层面上,数字图书馆通过对数字资源进行聚合,形成个性化、定制化、集成式的资源检索平台,用户一般是输入主题进行资源查找和获取,具有一定的指向性与特殊性要求,数字图书馆可以应用关联技术为其推送与主题关联性强的资源,缩短用户查找资源所需时间,提高资源获取效率。总之,用户与图书馆的交流共享十分重要,服务层可以随用户要求的变化而更新,这一层次的不同服务模式也可以实现数据的关联聚合与重组,更好地适应用户的知识发现需求。

3.2 知识发现层

知识发现层是基于关联聚合与关联分析的数字图书馆知识发现服务体系的核心环节。这一层主要是针对知识资源进行集中的数字化处理,包括关联聚合、关联分析和数据挖掘。具体而言,数字图书馆通过全面广泛地整理馆藏资源和互联网资源,将有效的知识信息纳入到知识库中,继而通过关联聚合与关联分析技术,将知识资源进行开发和分类,划分为专题知识库、学科知识库、特色资源库等不同类型。在这一过程中,主要包括数据预处理和数据挖掘评价2个方面:数据预处理是指数字图书馆通过数据集成的方式,提炼有效资源数据,剔除冗余信息,以保障图书馆知识发现服务数字资源基础的完整性和规范性,有利于下一步的数据仓库建设。数据挖掘评价是关键环节,其主要功能在于应用关联聚合与关联分析对知识资源进行动态聚类,从数据库中整理序列关联模式,并预测数据的关联规律,之后对知识库中的资源进行一致性处理。总之,通过知识发现层对图书馆数字资源的关联聚合与关联分析,可以将杂乱的数据以规律性、关联性的可视化方式呈现出来,使用户能够更加快速、精准地获取目标资源。

3.3 资源层

资源层是基于关联聚合与关联分析的数字图书馆知识发现服务体系的基础设施,由数据资源库、基本知识库与用户信息库构成。资源层既包括结构性数据也包括非结构性数据,既囊括了知识资源,也包含了用户数据,覆盖范围十分广泛,数据的基数也比较大,在这一层级全面开展数据的关联与分析无疑是一项艰巨的任务。图书馆在资源层要着重对用户信息库的数据进行归类和规律的探寻,采用数据挖掘技术能够准确地掌握用户阅读偏好,从而有的放矢地开展精准资源推送,为用户提供个性化强的知识发现服务,既节省了用户的时间,也提高了数字图书馆知识发现服务的效率。

4 数字图书馆知识发现服务策略

4.1 做好数据集范围规划

一般来说,知识资源的来源比较广泛,由不同数据集构成,数据集间相对独立,存在异构化特征,使得数据集可以将图书馆自身的数字资源聚合起来,也可以延伸到图书馆外部网络环境,极大地丰富了图书馆知识发现服务的资源物质基础。由此可知,在应用关联聚合与关联分析时,要对知识信息所涉及的范围做好规划,知识库中多学科信息不仅要包括馆藏资源,还要包括图书馆购买的商业数据库,此外,图书馆要对知识资源关系类型做好科学分析,以便进行聚合。

4.2 分层次对元数据进行描述

数字图书馆知识发现服务的内容往往涉及文献期刊、学术论文、学科专著等,图书馆通过对这类数据进行关联,建立源数据库,实现图书馆交叉学科知识资源的聚合与挖掘。笔者认为,首先要将知识信息类型划分作为重点,对非结构化数据进行详细分析,并将其进行结构化处理;其次,图书馆可以应用关联聚合技术注重知识资源间的关系划分,针对不同种类资源,用确定主题的方式,梳理其内在关联。总之,数字图书馆在应用关联聚合与关联分析技术时,要按步骤、分层次地进行。

4.3 建立关联立体的知识点体系

数字图书馆一方面要重视语义关系的建立,通过叙词表实现多领域、多学科不同概念的关联,使检索系统更加明晰化与高效化,减少用户知识发现的阻碍;另一方面,数字图书馆要注重知识单元的提取,通过关联聚合与关联分析技术将不同资源之间的知识点立体化表现出来,增强知识间的横向联系,从而提高知识服务效率。

5 小结

随着数字图书馆的发展和网络环境的普及,图书馆馆藏数据量与日俱增,如何科学有效地管理和使用纷繁的数字资源,是图书馆知识发现服务工作必须思考的问题。合理有序的资源储存和关联,可以提升数字图书馆知识发现服务的效率,反之,则会造成大量的资源浪费。通过笔者的研究,关联聚合與关联分析技术的应用可以解决知识信息孤岛、数据分散的难题,能够在一定程度上避免数据遗失问题,有效提升数字图书馆知识发现能力和服务水平,这也将成为未来图书馆知识发现服务的重要研究内容。

参考文献

[2] 成胤钟.基于关联聚合与关联分析的数字图书馆知识发现服务研究[J].农业网络信息,2017(12):122-125.

[4] 牟冬梅,王萍,张艳侠.基于关联数据的数字资源语义聚合策略[J].情报资料工作,2015(5):18-23.

[6] 陈良.基于语义关联的数字图书馆馆藏资源知识发现服务研究[J].农业图书情报学刊,2018,30(3):38-41.

[7] 朱纯琳.基于关联数据的数字图书馆知识发现系统研究[J].河南图书馆学刊,2017,37(11):101-103.

(收稿日期:2020-08-31)

(修回日期:2020-09-11;编辑:魏民)


转载注明来源:https://www.xzbu.com/1/view-15417018.htm

相关文章