您好, 访客   登录/注册

浅谈矿山企业信息管理系统中数据仓库的构建

来源:用户上传      作者: 刘启岳

  [摘 要]矿山企业信息系统以提高矿山企业生产经营管理水平和经济效益为目标,在矿山企业中引入数据仓库技术可解决矿信息系统建设与应用中的一些问题。本文以某矿为例,说明了矿山企业信息管理系统中数据仓库构建具体构建过程,。分析表明,数据仓库技术可进一步发挥信息系统在矿山生产管理中的重要作用。
  [关键词]矿山企业 信息管理系统 数据仓库
  中图分类号:TG3.7 文献标识码:A 文章编号:1009-914X(2014)34-0020-01
  0 引言
  数据仓库技术是为了有效地把操作型数据集成到统一的环境中以提供决策型数据访问的各种技术和模块的总称。所做的一切都是为了让用户更快更方便地查询所需要的信息,并提供决策支持。将数据仓库技术应用于矿山企业管理信息系统中,可以为矿山管理决策提供有力支持,使矿山企业管理信息系统的应用提高到一个新的水平。
  1 数据仓库的体系结构
  数据仓库的体系结构,包括数据源、数据准备区、数据仓库数据库、数据集市/知识挖掘库以及各种管理工具和应用工具。数据仓库在创建以后,首先要从数据源中抽取所需要的数据到数据准备区,在数据准备区中经过数据的净化处理,再加载到数据仓库数据库中,最后根据用户的需求将数据发布到数据集市/知识挖掘库中。当用户使用数据仓库时,可以通过OLAP等数据仓库应用工具向数据集市/知识挖掘库或数据仓库进行决策查询分析或知识挖掘。
  在整个系统中,数据仓库是整个系统的核心,用于存储经数据集成而来的所有数据,数据集成是数据仓库运行中必不可少的一个环节,它的作用是根据预先定义的主题数据,从OLTP环境或外来数据源中抽取数据,经过转换、清洗,装载到数据仓库中,然后通过数据管理来管理整个系统的运转并利用数据分析工具,如OLAP,对集成到数据仓库中的数据进行决策分析,将分析结果以多维视图、统计报表、可视化界面等方式展现给决策者。
  2 矿山企业数据仓库建设实例
  数据仓库的建设是一项长期、复杂、艰巨的工作,其实现难点主要集中在数据的收集、数据的存储和管理、联机分析处理和决策支持开发与应用环境等几方面。于是,某矿采用“自底向上”的方法建立企业数据仓库。
  2.1 矿山企业数据模型
  矿山企业数据模型定义矿山企业生产及其数据之间的关系,便于理解矿山企业的数据及描述所采集的数据,用于构造矿山企业的数据仓库,定义数据库和进行数据转换。因此,数据模型由矿山要素(实体)和这些要素的特征(属性)组成,根据不同的矿山要素和相应的属性描述,将属性一致的矿山实体或特征相同的矿山要素进行集合,目的是为了便于数据的集中管理、分析和显示。
  根据矿山生产需要,确定矿山企业数据模型为:矿山地质数据、矿山设计数据、矿山生产计划数据、采矿生产数据、选矿生产数据、矿山生产设备数据、矿山物资供应数据、人力资源数据、矿山财务与成本数据、矿山安全数据、矿区环境保护数据共十一大类。
  2.2 数据仓库平台的建设
  选择一个合适的数据库管理系统是数据仓库系统成功的基础,为了与矿山企业内部网络数据管理取得一致,同时具有较高的数据处理效率,通过分析、比较,最终选用了微软的SQL Server作为底层数据库平台。针对该矿计算机应用的实际情况,采用ODBC接口,通过模块化的方式把历史数据与管理信息系统的数据分开,保证日常管理应用系统的速度和运行效率。
  数据提取转换模块通过数据传输系统把不同应用系统的操作数据进行清洗、整理后,加载进入基于SQL Server的中心数据仓库。数据的提取方式有两种:一种是直接通过网络去读取操作数据库中的数据;另一种是针对部分应用系统的实际情况,在数据源端插入一个小程序,定期将数据提取出来并以一定格式传送到中心数据仓库。数据提取的同时,也提取数据之间的关系,并以一定的公式保存在数据仓库中。
  当数据从操作数据源中被提取、存储到数据仓库中时,数据的结构经过了优化,原始报表中的某些项目转化成为SQL Server 中新的项目,数据分析工具会提供多种角度、
  多种方式的数据分析、预测、诊断手段,实现管理人员的查询要求。
  2.3 几个关键问题的处理
  数据仓库的建设以数据为中心,其关键是数据的集成,主要包括如下几个方面:
  1)主题数据库的建立
  主题数据库是经过科学的规划和设计而建立起来的具有共享性和一致性的数据环境,其特点是面向企业的经营主题,而不是面向一般的应用项目,其数据结构和存储方式完全独立于职能区域和业务过程。主题数据库的建立需要在对企业信息需求进行全面分析和总体数据规划的基础上,建立其数据模型,对各类应用数据进行综合管理,设计出良好的数据库,其数据结构和存储方式与各种职能和业务过程对数据的使用方式无关,整个组织中的数据都是集约化的和共享的。
  2)统一代码
  整个系统要有统一的代码设计,包括公用代码设计和专用代码设计。
  公用代码包括单位代码、职工代码、子系统代码和功能代码等。专用代码包括程序
  名称代码、数据库(表)名称代码和数据字段名称代码等。部分编码示例见表1。
  表1 部分编码示例
  3)建立数据关联
  各子系统之间正常的数据调用,也即各数据库之间的数据关联,构成了一个完整的应用系统,保证了数据的唯一性和一致性。数据关联是在详细调查各子系统数据输入和输出的基础上建立的,本例采用建立数据调用表的方式来说明调入数据的路径、库(表)名和字段名,关联双方的数据类型和长度保持一致。
  3 结语
  数据仓库技术是20世纪90年代初发展起来的数据领域的一种新型技术,它在数据的管理和使用上与传统数据库有本质的区别。构建基于数据仓库的决策支持系统是信息技术发展的新趋势。实践证明,在管理信息系统中应用数据仓库技术按照一定的规则重新组织数据,可以获得较强的信息存取能力和信息分析能力,更好地满足决策的需求。
  参考文献:
  [1] 臧劲松.基于数据仓库的教学管理信息系统的研究与应用[J].电脑开发与应用,2009(11).
  [2] 梁丹凝,龙草芳.民声通道数据仓库的设计与实现[J].电脑知识与技术,2013(06).
  [3] 包冬冬.企业数据仓库技术应用探讨[J].中国新通信,2013(06).
  [4] 宋巧姐.建立会计数据仓库及其在财务审计中的应用研究[J].现代商业,2014(02).
  作者简介:
  刘启岳(1981-),男,汉,现为安徽理工大学计算机科学与工程学院硕士研究生,研究方向:计算机应用,数据挖掘。
转载注明来源:https://www.xzbu.com/1/view-6376821.htm