您好, 访客   登录/注册

基于近似匹配模型的元数据检索方法

来源:用户上传      作者:

  摘要:本文提出一种基于近似匹配模型的元数据检索方法。引入三层架构模式,设计元数据检索框架;计算元数据与近似表格关联值,建立两者映射关系;划分元数据匹配类型,处理检索结果,提供用户结果推送。设计实验,验证提出方法证明有效的缩短数据响应时间,更具市场价值。
  关键词:近似匹配模型;元数据;检索方法;适配
  中图分类号:TP391 文献标识码:A 文章编号:1007-9416(2020)03-0098-02
  元数据又称中间数据或中介数据,为描述数据衍生的一种数据形式,主要用于表达数据集合的属性,提供数据集的储存位置、资源定位、信息检索、历史数据查询等功能。在使用中将元数据归属于电子目录,为了满足数据的最终传输目的,需要在数据传输过程中采用元数据表达方式描述数据特征[1]。核心数据集合是元数据在市场中最为广泛的一种表达方式,尽管元数据在多个行业中具备了广阔的应用前景,但目前针对元数据的在线检索仍延用传统的数据库检索方式,导致大批量数据集在检索过程中对于资源对象检索的覆盖率较低。
  1 基于近似匹配模型的元数据检索方法
  引入三层架构模式,结合近似匹配模型在元数据检索中的应用,设计元数据检索框架。如图1所示。
  根据图1表述信息,将元数据检索按照结构功能分成三层。其一为应用层,主要提供用户实施元数据检索进入端口。其二为服务层,作为元数据检索的核心,引入多服务器组织模式,定义用户访问检索通道权限,对网络实施安全控制,配备身份注册端口,此外提供数据备份管理功能[2]。其三为数据层,包含多个数据库,用于存儲不同数据代理身份信息、多元化元数据表达形式,提供元数据管理渠道。
  1.1 建立元数据与近似表格映射关系
  基于上述搭建的元数据检索框架,结合近似匹配模型理论依据,根据数据实际需求,对指定数据实施标准化描述,建立元数据标准树,分析数据集中节点数据,并将节点统一归类值信息对象阈值范围内,以此即可定义信息对象与标准数据数的关系。依照数据关联方式,计算表格数据与元数据联系值。计算公式如下。
   (1)
  公式中:表示为元数据与近似表格的连接值;表示为数据集中数据节点数量;表示为检索中数据偏转角度;表示为元数据特征表达方式;表示为数据集横向数据值;表示为数据集纵向数据值。根据上述公式,实施数据一次匹配,记录有关节点数据,获取特征数据节点。统一元数据格式,剔除无用点信息,建立两者有效的映射关系。
  1.2 划分元数据匹配类型
  假定应用层用户在实施元数据检索时仅提出终端数据,无明确数据所属类型,可按照元数据划分标准,实施数据集预处理操作,得到初期数据匹配信息,整合数据集合中近似值,将与查询树有关的数据集合对用户匹配值实施数据预处理操作,配对嵌入数据值,并以元数据描述的方式匹配代价最小的终端元数据。同时,将缺少的类型部分按照阈值所属模式以资源对象方式反馈给用户。剩余数据按照Ma数据模式实施匹配数据匹配操作,循环上述操作直至输出用户满意数据。
  1.3 检索结果处理与推送
  基于上述输出的终端数据,下述将出数据评估方式,整合数据中节点个数,结合用户兴趣模型,按照检索中关键数据、数据类别等方式评价数据组。分析元数据在数据集合中的空间分布特征,并采用多终端服务器的方式对数据目录获取直接检索数据,结合空间数据具有的异构性特点,获取数据中潜在的联络基础。此外在使用中,结合数据库在其中发挥的作用,实时备份关键数据,避免由于网络异常或其它原因造成数据检索失效,将满足检索要求的元数据集合按照用户浏览历史实现推送,完成基于近似匹配模型的元数据检索方法设计。
  2 仿真实验
  提出仿真实验,模拟实验所需环境,使用JAVA计算机语言搭建B/S结构实验平台,引入野外实验调查组获取的数据集,采用元数据对数据集实施特征描述,并以xml.格式文件存储至指定数据库中,遵循元数据划分标准,提出下述检索要求:定义实验参数,数据集数量规模为s,元数据检索深度为d,数据集合中节点数量为n;定义多组不同数据量,按照查全率定义数据终端输出结果。
  根据实验结果,可得出如下实验结论:随着S数据量的增多,实验组数据响应时间上升相对平稳,具有一定检索规律,相对传统的元数据检索方法,本文设计的方法在实际应用中,可有效的缩短数据检索响应时间,进而起到提升元数据检索效率的作用。
  3 结语
  本文从3个方面,基于近似匹配模型,开展了元数据检索方法的研究。并通过设计仿真实验的方式验证了本文提出的方法,在实际应用中可有效的缩短数据响应时间,起到提升元数据检索效率的作用。尽管本文的研究已经取得了初步的成绩,但仍缺乏大量数据为其提供支撑,以此在后期发展中,应加大该方法在元数据检索中的应用,为技术的应用提供真实的数据支撑。
  参考文献
  [1] 白雪,李广利,牛爱菊.Alma环境下电子资源元数据的管理及对用户的影响——以北京师范大学图书馆为例[J].新世纪图书馆,2019(05):49-52.
  [2] 姚兰,金钰博,顾佳良.云环境下基于动态聚类及相似树查询的无线体域网隐私数据检索算法研究[J].计算机与数字工程,2019,47(02):360-366+441.
  Abstract:This paper proposes a metadata retrieval method based on approximate matching model. Introduce a three-tier architecture model to design a metadata retrieval framework; calculate metadata and approximate table association values to establish a mapping relationship between them; divide metadata matching types, process retrieval results, and provide user results push Design experiments to verify that the proposed method proves that the data response time can be shortened effectively and has more market value.
  Key words:approximate matching model; metadata; retrieval method; adaptation
转载注明来源:https://www.xzbu.com/8/view-15232929.htm