您好, 访客   登录/注册

试论数据挖掘技术在Web预取中的应用

来源:用户上传      作者:王志俊

  摘  要:近年来,互联网的不断发展,使人们对数据的需求不断扩大,这也使数据挖掘技术成为互联网领域中至关重要的技术,通过数据挖掘技术,可使人们从海量信息中筛选出自身所需的有效信息,随着数据挖掘技术的发展,其在Web技术中正发挥着越来越重要的应用价值,尤其是在Web预取方面,通过数据挖掘技术的运用,可使数据查询变得更加准确,从而实现Web资源的多方共享。鉴于此,该文便对数据挖掘技术在Web预取中的应用进行深入的研究。
  关键词:数据挖掘  Web预取  搜索引擎
  中图分类号:TP391    文献标识码:A 文章编号:1672-3791(2019)07(c)-0019-02
  随着网络的普及与应用,在Web预取中运用数据挖掘技术已经成为互联网领域中的一种新型运用手段,数据挖掘技术可帮助人们对用户的访问模型进行查询,同时还可通过聚类分析以及信息监听等手段来生成与用户有关的相关信息档案,从而了解用户在不同页面中所产生的行为规律,进而为用户提供更加高效优质的信息服务。不过,就目前来看,如何将数挖掘技术更加合理地运用于Web预取中,以此最大限度地发挥数据挖掘技术的作用,仍旧需要进一步加以研究与探讨。
  1  数据挖掘技术在Web预取中的发展历程
  现阶段,越来越多的搜索引擎企业都迎来了高速发展阶段,这也使搜索引擎在人们的日常生活中发挥着越来越重要的作用。据相关调查表明,搜索引擎已经成人们在使用互联网的重要工具,大部都会作为应用工具检索用户所需的数据。由于搜索引擎企业众多,这也使不同的检索机制有着很大的区别,从而造成数据查询结果多种多样,因此在使用搜索引擎时,需要结合信息数据的类别及用户的行为习惯与实际需求来确定。在搜索引擎应用初期,人们需要解决检索数据结果的排序问题,部分搜索引擎还要收费,费用投入越大的企业,在网站上的排名就越靠前,这很难达到用户的数据检索要求,因此需要对数据运用相关性进行彻底改变,使与关键词相近的检索结果能够排在首位,因此对于许多大型网站,相同数据通常都会在前端显示。当用户访问某个网页时,往往会点击链接来访问其他页面,这时便要预测用户的访问信息,然后根据预测结果来对这些页面进行预先下载,以此提高用户对页面的访问速度。由此可以看出,在预取Web中的链接时,减少页面链接或采用不同Web服务器,可使页面具备更佳的运行效果。不过,事实上许多用户都不会访问全部页面,因为这会对用户的使用造成一定的影响,并且因用户是利用流量来进行上网的,如果全部访问,反而会产生大量支出,這势必会给Interent系统的流量平衡带来不利影响。而Web预取则能够按照特定的排序方式来排序页面连接,并根据用户的访问概率来预取对应页面,同时需要考量系统运行情况,通过兴趣关联数据库来进行相应的考量。
  2  数据挖掘技术在Web预取中的应用
  2.1 可提高Web预取数据的准确性
  由于在互联网中分布着海量的信息,因此在海量信息中查找自身所需的有效信息时,即使采用最为高效的搜索引擎,仍旧会在数据筛选中出现各种问题,并且,互联网所具有的开放性、共享性特点,使人们能够在不同地点、不同时间进行随时随地的信息传输,这也使信息数据每时每刻都在海量增长着,而利用搜索引擎,只能对这些海量数据中的一部分进行筛选,否则反而会对搜索引擎的实际应用效果造成影响。不过,如果在搜索引擎中运用数据挖掘技术,则可很好地解决该问题。通常来说,数据挖掘技术主要包括3种,分别是内容挖掘、结构挖掘以及具有使用记录的数据挖掘,其中尤以内容挖掘最为常用。在检索这些内容数据时,需要对相应的条件进行设置,而且用户需要对所需数据有一定的了解。相比于以往的搜索引擎技术,数据挖掘技术虽然在挖掘速度上不占据优势,但其却可以更加全面而准确地对信息进行检索,并且,通过添加人工智能模块,还可对这些检索数据实施相应的处理,从而使技术的智能化水平更高。反之,如果采用以往的搜索引擎技术对数据进行检索,则检索到的数据还要经过相应的筛选才能使用,但对于数据挖掘技术来说则不同,其可直接利用检索数据。
  2.2 可应用于电子商务领域
  在Web预取中,由于用户所需的数据不同,因此在运用数据挖掘技术时应考虑到不同用户对数据的实际需求。当用户所需数据是用于艺术设计的,则需要添加和筛选新颖而独特的流行元素;如果用户所需数据是用于商业活动的,则数据挖掘技术的运用目为筛选有效的客户资源。近些年来,互联网技术的快速发展,使网络购物已成为一种新型的购物模式,这也使电子商务迎来了高速发展阶段,相应的,越来越多的企业开始投入到电子商务领域中,这也使电子商务所面临的市场竞争环境变得愈发激烈。在此背景下,企业要想在电子商务领域中占据一席之地,就必须要尽最大努力来对现有的客户资源进行扩大,而通过调查可以了解到,许多用户在进行网络购物时,都会利用搜索引擎来查看与搜集自己所需的商品信息。因此,将数据挖掘技术应用于电子商务网站中,可使网站中的商品信息得到有效的优化与处理,进而使网站能够满足不同用户的购物需求,同时还能根据这些用户的需求来对更多潜在的用户进行挖掘。在运用数据挖掘时,所需数据主要来自于两个方面,一是客户的历史购物或浏览记录、客户基本信息等,二是用户点击量。通过以上数据可帮助企业考察用户的行为,这些数据都可从服务器中获得。在利用数据挖掘技术时,不需要直接挖掘原始数据,而是需要先处理这些数据,例如对数据进行合并,使不同数据库或文件中的数据能够合并起来,然后从中选择合适的数据进行提取与集合,并对这些提取与集合的数据进行相应的清洗与过滤,使数据中的不必要信息能够得以清除,然后利用文件、多媒体等格式来转换这些数据,以此确保数据挖掘格式变得便捷而安全。通过与不同目标进行结合,采用多种查询方式,最后可获得有价值的数据,这时便可通过技术手段的运用,对整合数据进行分析,从而确保数据的价值得到可靠保证。数据挖掘技术除了能够在电子商务领域中应用以外,还可运用于其他所有与Web有关的领域,例如企业日常运营,通常需要设置一个局域网来便捷内部办公,使企业网络能够和互联网进行连接,从而保障企业和外部的信息畅通,使企业在发展中能够获得更多有价值的数据来提供参考。
  3  结语
  总而言之,随着互联网的高速发展,数据增长量不断扩大,这也给人们对信息的检索带来很大难度。搜索引擎凭借其准确、高速的应用优势,已经成为人们在互联网中进行数据挖掘的重要工具,不过因互联网的信息更新速度非常快,这会给搜索引擎的运用带来很大影响,因此,将数据挖掘技术运用于搜索引擎中,已经成为搜索引擎不断发展的未来趋势,通过数据挖掘技术的运用,能够使人们在应用搜索引擎时,能够实现对检索数据的直接处理,进而使数据挖掘效率得到显著提高。相信在不久的将来,现代化信息技术的不断发展,必将使数据挖掘技术变得更加完善,从而使其在实际运用中发挥更大的应用价值。
  参考文献
  [1] 谢怡文.试分析数据挖掘技术在Web预取中的应用[J]. 电脑编程技巧与维护,2017(7):66-67,74.
  [2] 白亮.基于Agent技术的Web个性化数据挖掘研究[J].长春师范大学学报,2015,34(12):43-46.
  [3] 邢国春,李紫薇.基于J2EE技术的Web预取中个性化信息智能挖掘模型研究[J].情报科学,2014,32(9):104-107.
转载注明来源:https://www.xzbu.com/8/view-15041779.htm