探索中国CIO人才现状 | 第四季调研报告
基于数据挖掘技术的煤炭企业ERP应用
2014-02-18  作者:万方数据 

 前言

    随着以计算机为主的信息技术的发展,煤炭企业的数据量越积越多,但其中能为企业管理者有用的信息并不多,这里的有用的信息主要是能为企业决策者提供依据或提供参考的信息。数据挖掘是从大量的、不完全的、有噪声的、甚至是随机的数据中提取隐含在其中的、人们事先不知道的但又是潜在有用的信息和知识的过程。它可以按照企业的管理目标,对企业的大量数据进行分析和处理,挖掘其中隐藏的、未知的规则和信息,并进一步将其模型化,然后将分析结果用于管理决策,提高企业管理者的决策能力和决策水平,进而提高企业管理者的管理效率和企业的经济效益。

    目前,许多企业都广泛采用了ERP软件系统,但由于ERP软件本身功能的不足,有的只能提供基本的数据查询和分析。有的缺乏对高层次的数据分析和决策行为的支持,这就需要通过数据挖掘技术在ERP中的应用来改善现有ERP系统。

1 数据挖掘技术

    1.1 数据挖掘的概念

    数据挖掘,在人工智能领域,习惯上又称为数据库中的知识发现(Knowledge Discovery in Database,KDD),也有人把数据挖掘视为数据库中知识发现过程的一个基本步骤。知识发现过程由以下3个阶段组成:(1)数据准备;(2)数据挖掘;(3)结果表达和解释。数据挖掘可以与用户或知识库交互。典型数据挖掘系统的结构如图1所示。

 

    并非所有的信息发现任务都被视为数据挖掘。例如,使用数据库管理系统查找个别的记录,或通过因特网的搜索引擎查找特定的Web页面.则是信息检索(information retrieval)领域的任务。虽然这些任务是莺要的。可能涉及使用复杂的算法和数据结构,但是它们主要依赖传统的计算机科学技术和数据的明显特征来创建索引结构,从而有效地组织和检索信息。尽管如此.数据挖掘技术也已用来增强信息检索系统的能力。

    1.2 数据挖掘的过程


    第1步确定挖掘对象

    清晰地定义出主题业务,明确数据挖掘的目的是数据挖掘的首要步骤,挖掘的最后结构是不可预测的,但要探索的问题应是具有预见性的,为了数据挖掘而数据挖掘则带有盲目性,是不会成功的。

    第2步挖掘前的准备

    (1)数据选择

    搜索所有与业务对象有关的内部和外部数据信息,并从中选择出适用于数据挖掘应用的数据。

    (2)数据预处理

    研究等挖掘数据的质量,为进一步的分析做准备,并确定将要进行的挖掘操作的类型。

    (3)数据转换

    将待挖掘数据转换成一个分析模型。这个分析模型是针对某种或某几种挖掘算法建立的,建立一个真正适合挖掘算法的分析模型是数据挖掘成功的关键。

    第3步数据挖掘

    对所得到的经过转换的数据进行挖掘。除了完善从中选择合适的挖掘算法外,其余一切工作都应该可以自动地完成。

    第4步数据结果分析

    解释并评估分析结果,其使用的分析方法一般应依数据挖掘操作而定,通常情况下可能会用到可视化技术。

    第5步知识的同化

    将数据分析所得到的知识集成到业务信息系统的组织结构中去。

2 煤炭企业ERP的功能分析

    企业资源计划(Enterprise Resource Planning,ERP)是建立在以计算机为主的信息技术基础上,利用现代企业的先进管理思想,全面集成企业各种资源信息,为企业提供计划、组织、控制和决策等方面的全方位和系统化的管理平台。煤炭企业ERP涉及煤炭企业的采购管理、生产管理、销售管理、物流管理、财务管理以及人力资源管理等各个方面的管理问题。

    中国煤炭企业经过多年的努力,企业信息基础设施建设已经具备一定规模,在信息建设和资源管理等方面,计算机设备和计算机应用水平处于国内领先地位。煤炭企业高层已经意识到了以计算机为主的信息技术的是企业行业领域的发展趋势,煤炭企业会计信息系统逐步从核算型过渡到财务管理型,适应ERP企业的管理模式,具有财务分析和领导决策功能,覆盖整个财务、采购、销售等工作范围,成为ERP和电子商务系统的核心系统。

    但是在煤炭企业ERP实施当中,随着ERP软件系统积累的数据不断增加,数据管理相对落后的问题已随之出现。传统的数据分析和处理方法(如查询、报表)根本无法快速、有效地从大量数据中获取所需的数据,煤炭企业ERP系统自身也缺乏高层次的数据分析和决策支持手段,只能提供较为简单的数据显示和数据查询,企业管理决策者们无法从庞大的业务数据中获取隐藏的知识,这就使得数据挖掘技术在煤炭企业ERP的数据分析和处理中有广泛的应用空间。

3 数据挖掘在煤炭企业ERP中的应用实例

    为了证实基于数据挖掘技术的煤炭企业ERP的应用的可行性和有效性,通过下面相关实验进行说明。通过对近年来中国部分煤炭企业ERP系统数据库的查询,得到了2006~2010年煤炭企业营业额的相关数据(见表1),利用数据挖掘进行未来3a的营业额数据预测。

 

    预测方法采用灰色预测模型GM(1,1)。灰色理论的微分方程模型称为GM模型(Grey Model)。模型是将原始数据列作生成处理后建立模型方程。GM(1,1)表示1阶1个变量的微分方程模型模型。

    建模的步骤如下:

    (1)由原始数列x(0) ,计算累加生成数列x(1) 。

    (2)对x(1) ,采用最上二乘法按下式确定模型参数:
 
 

    (3)建立预测模型,求出累加序列:

 
计算之后,可得预测结果,如表2所示。

表2中国部分煤炭企业营业额预测值单位:亿元
 

    实验结果表明,GM模型预测精度较高,这说明单变量灰色预测在煤炭企业销售最预测中是可行的,其分析结果对于煤炭销售策略的制定、市场细分、目标客户群的确定具有一定的参考价值。

4 结语

    煤炭企业与标准的制造业相比,具有很多不同的特点,研究煤炭企业实施ERP的可行性和解决方案具有很强的理论和实际意义。文中通过对煤炭企业各种数据深入分析,探索数据仓库和数据挖掘技术在ERP企业中的应用模式,建立基于数据挖掘技术的煤炭企业ERP系统,从而提高煤炭企业ERP系统的决策功能,真正做到运用数据挖掘等信息技术改造传统的煤炭企业,优化企业资源,提高决策分析水平,增强综合竞争力。