您好, 访客   登录/注册

中医信息化与数据挖掘相关文献的计量分析

来源:用户上传      作者:

  摘要:目的  分析中医信息化与数据挖掘研究的状况,为中医信息化与数据挖掘研究提供参考。方法  检索中国生物医学文献数据库内中医类别文献,采用主题检索方法,检索词为“中医*”和“大数据OR信息化OR结构化OR标准化OR信息标准”等。检索时间2000年1月1日~2017年12月31日,运用文献计量分析方法对各主题文献发表量进行升降趋势分析。结果  共检索出文献2951篇,发文量呈逐年增长趋势,研究领域集中在中医信息化、中医信息化建设、中医信息标准和中医信息抽取。其中在應用数据挖掘、大数据、人工智能、本体、信息化、信息化建设、标准化、术语、语义、结构化、知识图谱、知识发现及互联网方面的研究文献呈逐年上升趋势(P<0.05),特别在中医信息化、标准化、数据挖掘及互联网研究的文献呈明显的上升趋势(P<0.05),但在辅助决策、信息标准、信息抽取、自然语言及知识库方面的研究发文量基本稳定(P>0.05)。结论  中医信息化建设、标准化、数据挖掘及互联网研究是近年来的热点方向,中医研究无论在古籍文献挖掘、临床研究中均采用数据挖掘的方法和技术。
  关键词:中医;信息化;数据挖掘;文献计量学
  Abstract:Objective  To analyze the status of TCM informatization and data mining research, and provide references for TCM informatization and data mining research.Methods  Retrieval of Chinese medicine category documents in the Chinese biomedical literature database, using the subject search method, the search terms were "Chinese medicine*" and "big data OR information OR structured OR standardized OR information standard". Retrieval time January 1, 2000-December 31, 2017, using literature measurement analysis method to analyze the trend of the publication volume of each subject literature.Results  A total of 2951 documents have been retrieved, and the number of articles published has been increasing year by year. The research areas are concentrated on TCM informatization, TCM informatization construction, TCM information standards, and TCM information extraction. Among them, the research literatures in applied data mining, big data, artificial intelligence, ontology, informatization, informatization construction, standardization, terminology, semantics, structure, knowledge graph, knowledge discovery, and Internet are increasing year by year (P<0.05),especially in the literature of Chinese medicine informatization, standardization, data mining and Internet research, there is a clear upward trend(P<0.05), but the amount of research papers published in the areas of decision-making assistance, information standards, information extraction, natural language and knowledge base is basically stable (P>0.05).Conclusion  Informatization construction, standardization, data mining and Internet research of traditional Chinese medicine have been hot topics in recent years. Traditional Chinese medicine research adopts data mining methods and techniques in ancient book literature mining and clinical research.
  Key words:Traditional Chinese medicine;Informatization;Data mining;Bibliometrics
  随着信息化、数字化、网络化飞速融入社会各行各业及人民日常生活中,“中医药现代化”显得越发重要[1]。中医及其他传统医学应积极顺势而为,以创新的思维,充分利用现有政策优势,加快中医信息化研发,这不仅为传统医学赢得更多发展空间的需要,更是护佑传统医学生命的需求。数据挖掘是从大量目标数据中挖掘出有趣模式和知识的过程,是中医信息化的重要方法之一[2]。近年来中医药飞速发展,积累了大量的数据,数据挖掘因其能够从大量的数据中挖掘出数据项之间关联性地特性被广发运用于中医药研究[3-6]。为了解有关中医信息化及数据挖掘方向的发展动态,本研究以中国生物医学文献数据库(CBM)为基础对其相关研究进行文献计量学分析,旨在反映其研究概况和发展方向,为今后相关研究人员选择研究方向提供参考。   1资料与方法
  1.1资料来源  选择《中国生物医学文献数据库》(CBM)数据库,以“中医”和“大数据OR信息化OR结构化OR标准化OR信息标准OR信息化建设OR互联网OR术语OR本体OR语义OR知识库OR自然语言处理OR信息抽取OR知识发现OR知识图谱OR数据挖掘OR机器学习OR人工智能OR辅助决策”为检索词,查找有关中医信息化及数据挖掘的相关文献,检索时间设置为2000年1月1日~2017年12月31日。纳入标准:研究内容为中医信息化。排除标准:会议文摘、行动研究、综述、书评、新闻、资料及需要电话或纸质索取、非公开发表或校正等类型文献。
  1.2方法  检索记录2000~2017年每年各类相关文献的篇数,应用Microsoft Office Excel 2016建立数据库,进行数据的预处理,导入SPSS 17.0统计软件包生成数据库。获取文献主题特征,从发表文献数、主题分布方面对中医文献中的“信息”“数据挖掘”“人工智能”“语言语义”“知识库”“知识发现”“互联网”领域依次分析。运用构成比进行数据的描述性分析,运用SUM Test进行文献发表的升降趋势检验,检验水平α=0.05。
  2结果
  2.1中医信息文献分析  2000~2017年,CBM数据库共收录有关中医研究的文献中发表信息化的文献2951篇,呈逐年上升趋势,2017年发表量是2009年的3倍多。发文的主题主要为中医信息化、中医信息化建设、中医信息标准和中医信息抽取。其中,在信息化、信息化建设方面的文献发表量经升降趋势SUM Test检验,差异有统计学意义(P<0.05),而在信息抽取、信息标准化方面的文献发表量无上升趋势(P>0.05),见表1、表2及图1。
  2.2中医文献涉及数据挖掘、人工智能发表量的分析  2000~2017年,有关中医研究的文献中发表数据挖掘相关的文献量逐年增多,尤其是近几年发表量上升速度明显,2014~2017年文献发表量上升趋势呈现直线化增长。在大数据方面的文献发表量从2012年开始呈现连续上升趋势,2017年是2012年的21倍。在人工智能方面研究的文献发表量增长幅度则略小于数据挖掘和大数据,但尽管如此,2016年发表的文献篇数仍达到了2007年的2倍多。在对于本体的研究方面,发表的文献篇数虽有波动,但总体呈现上升趋势,2017年发表的文献篇数达到2006年的4倍。然而,在辅助决策方面的研究文献则相对较少。在数据挖掘方面的文献发表量经升降趋势检验,差异有统计学意义(P<0.05);在辅助决策方面的文献发表量无上升趋势(P>0.05),见表3、表4及图2。
  2.3语言语义应用的文献发表量分析  2000~2017年,有关中医研究的文献中发表标准化的文献量最多,2017年发表量是2006年的4倍多。在术语方面,研究文献发表量总体呈上升趋势,2017年文献发表量是2006年的4倍。在结构化研究方面,文献发表增长趋势较为平缓。在语义、自然语言处理方面的文献则相对较少。在术语方面的文献发表量呈上升趋势,差异有统计学意义(P<0.05),提示文献发表量呈上升趋势,而在自然语言处理方面的文献发表量无无上升趋势(P>0.05),见表5、表6及图3。
  2.4 知识库、知识发现及互联网的文献发表量分析  2000~2017年中医研究领域有关知识发现方面的研究文献发表量相对较少,从2000开始每年不超过6篇,2015年开始增加到12篇,2016年为28篇,2017年为30篇。文献发表量呈上升趋势,差异有统计学意义(P<0.05)。在互联网方面的研究也逐渐增多,2000年开始不高于5篇,2006激增到12篇,2010年及增大21篇,2017年已增加到39篇,文献发表量呈上升趋势,经升降趋势检验差异有统计学意义(P<0.05)。在知识库方面的文献发表量很少,2000~2003年、2008年为0,其余年份发表量均不超过3篇,文献发表量无上升趋势(P>0.05),见表7。
  3讨论
  随着计算机的发展,互联网在各领域的广泛应用,人工智能及数据挖掘等相关技术在中医药研究领域的应用日趋增加[7]。本文查阅了中医信息与数据挖掘的相关文献,采用文献计量分析方法,结果发现在信息建设、信息技术应用、数据挖掘、大数据、人工智能、本体、信息化、标准化、术语、语义、结构化、知识图谱、知识发现及互联网方面的研究文献呈逐年上升趋势(P<0.05),尤其在中医信息化建设、标准化、数据挖掘及互联网研究的文献呈明显的上升趋势(P<0.05),提示中医信息化建设、标准化、数据挖掘及互联网研究是近年来的热点方向,与当前我国中医药信息化领域基础建设不健全、数据标准未解决的现状很相符。随着对中医信息化的深入了解与重视,更多的研究者可能会应用信息化和数据挖掘的方法助力中医药研究的开展与实施。
  中医药现代化和信息化建设是未来发展中医药的重要手段。数千年中医中药的实践积累了大量的数据资料,对其进行信息化处理,有助于中医药的传承和传播[1]。因此,利用现代信息、数据挖掘等技术和方法,研究中医古籍文献,从中抽提中医知识,进行知识信息的标准化,将文本信息转化、规范,进行挖掘,提取名医在诊疗疾病过程中的隐性知识显性化,挖掘有一定疗效的理法方药,进行新药的开发,将对传承中医中药是非常重要的[8]。
  同时,我们也发现当前的研究热点未能赶上国家的热点需求。我国首次提出“互联网+”的行动计划以来,医疗和信息正处于融入整合跨越发展的关键时期,国家先后出台了《“十三五”全国人口健康信息化发展规划》、《新一代人工智能发展规划》、《关于促进“互联网+医疗健康”发展的意见》等多项政策,均对中医药信息化的发展提出了明确的要求和任务。但中医药信息化在机器学习、人工智能领域的研究人员少、研究成果有限,未来需进一步加强中医药与信息技术、人工智能等方面的合作与研究。
  综上所述,中医信息化建设、标准化、数据挖掘及互联网研究是近年来的热点方向,中医研究无论在古籍文献挖掘、临床研究中均采用数据挖掘的方法和技术。
  参考文献:
  [1]徐宏伟.中医信息化研发“刻不容缓”[N].中国中医药报,2016-11-25(003).
  [2]Witten IH,Frank E.Data Mining:Practical machine learning tools and techniques[M].Morgan Kaufmatm,2005.
  [3]张国磊,刘健,忻凌,等.基于895份住院病例数据挖掘的中医药治疗强直性脊柱炎用药规律研究[J].江西中医药大学学报,2019,31(3):30-34.
  [4]许鸣,闻惠,沈娟惠,等.基于K均值聚类算法和关联规则算法的中医药治疗乳腺癌数据挖掘研究[J].中国乡村医药,2019,26(13):19-20.
  [5]高毅超,王凡,郭晶.数据挖掘技术在中医药领域中的应用概况[J].湖南中医杂志,2019,35(7):182-185.
  [6]李志坚,唐良华,殷天坪.基于数据挖掘中醫药治疗神经根型颈椎病的用药特点[J].贵阳中医学院学报,2019,41(04):53-57.
  [7]徐静雯,夏菁,邸若虹,等.数据挖掘技术在中医药研究中的应用进展[J].医学综述,2019(18):3672-3676,3681.
  [8]张姣姣,刘云,程旖婕.基于文献计量学定律的大数据应用领域发展规律研究[J].知识管理论坛,2016,1(5):384-392.
  收稿日期:2020-03-27;修回日期:2020-04-03
  编辑/成森
转载注明来源:https://www.xzbu.com/1/view-15248008.htm