探索中国CIO人才现状 | 第四季调研报告
统计数据挖掘在CRM中的应用分析
2014-03-11  作者:万方数据 

  21世纪是以网络为代表的信息技术突飞猛进的时代,随着网络的飞速发展和经济全球化所带来的激烈挑战,信息技术已经成为现代企业进行经营管理不可或缺的支撑。企业可获得的数据在急剧增长,对客户数据进行全面收集、集成、分析与利用是CRM实施的基础。如何管理和分析海量的客户信息,并从中找出对CRM决策有价值的知识?这需要更先进的技术和工具的支持,即数据挖掘技术。


  一、统计学与数据挖掘的关系


  数据挖掘与统计学都试图从数据中发现某种结构,从而得到有价值的信息,所以从数据挖掘诞生时起,就与统计学有了不可分割的联系。统计学、数据库和人工智能共同构成数据挖掘技术的三大支柱。统计学是搜集、展示、分析以及解释数据的科学,统计学并不是方法的罗列,而是处理数据的科学。数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的数据中提取隐含的、事先不为人们所知的、潜在有用的信息和知识的过程。数据挖掘大部分核心功能的实现都以计量和统计分析方法作为支撑。数据挖掘本身是多学科交叉科学,应用了统计学、计算机、数据仓库、神经网络等多种技术。


  二、统计数据挖掘技术在CRM中的应用


  要使数据挖掘在商业活动中起作用,就要把它与基本的商业过程关联起来。数据挖掘是企业同客户打交道的诸多步骤中的第一个。它要发现的是商业活动中各个因素与客户行为之间的不直观的关系。统计数据挖掘技术对于新客户开发、交叉销售及预测、顾客维系、顾客细分、关系赢利性识别等CRM功能都能提供良好的技术支撑。


  (一)应用流程


  1.顾客获取。对大多数企业而言,发展新客户、扩大客户基础的确是企业成长的一种主要方式。通过数据挖掘实现顾客获取就是利用客户档案找出客户的一些共同特征,通过聚类分析对客户分群,再通过模式分析预测潜在客户。通过预测潜在客户对开发活动的反映,从中识别出反映积极的客户,帮助市场人员对潜在客户进行筛选,然后有针对性的进行营销活动。


  2.客户细分。客户细分是根据企业需求,将客户划分为多个小的同质群体的过程。同属一个群体的客户往往有相似的需求,这样,营销人员就容易对其进行营销组合,有针对性的实施营销策略。客户细分中比较典型的数据挖掘技术是决策树和聚类分析方法。


  3.交叉销售及预测。现代企业和客户之间的关系是经常变动的,交叉销售是使这种关系趋于稳定的一种手段。利用市场购物蓝图分析挖掘客户对产品的消费模式,找出客户最容易一起购买哪些产品,从而有效的决定产品组合、产品摆放等。利用序惯分析预测客户在买了某一样产品之后,多久就会买另一样产品。这样做的结果是:企业获得了更高的商业利润,客户得到了所需要的产品和服务,从而使双方达到双赢的状态。


  4.顾客维系。随着获取新客户的成本不断提高,对企业而言,维系老客户,保持原有客户的价值就显得越发重要。在客户保持中,通常涉及三个数据挖掘模型,首先建立模型用来预测和识别潜在流失者,然后挖掘和识别潜在流失者中的黄金客户。最后对黄金客户中的潜在流失者进行分析挖掘,识别其行为模式,从而实行有针对性的营销策略以保持这些客户。


  5.客户赢利性识别。对企业来说,客户的数量并非越多越好,而是能够给企业带来赢利的客户越多越好,因为不同客户的赢利能力对企业的贡献率是不同的。企业通过设置计算赢利能力的参数,利用数据挖掘对客户信息、客户历史交易记录和售后服务等信息进行分析,对客户进行分类,预测其未来的购买模式和购买行为。这样就可以在市场营销的过程中对有价值或潜在的客户投入更多精力和财力,向他们提供及时的个性化服务,既可以留住这些客户,又可以有针对性地开展交叉销售,提高其对企业的赢利能力。


  (二)主要统计方法


  1.运用描述性统计分析方法对数据进行初步分析。描述性分析是对初步整理后的数据资料进行分析,并用统计量描述这些资料的一种方法。它主要包括了相对指标分析、图表法、集中趋势和离散趋势分析、相关分析等。


  相对指标是运用对比的方法,反映某些相父事物之间数量联系程度的综合指标。利用相对指标可以表明现象的相对水平、普遍程度及比例关系,可以使某些不能直接对比的总量找到对比的基础,可以比较事物的发展程度、内部结构及比例,可以使不能用总量指标直接对比的非同类现象之间进行比较。


  图表法属于描述统计学,它就是以图形或表格的形式来表示总体变量值的分布状况,它的表达形式比较简明、直观。统计表格根据它的内容可以分为频次表、百分比表、累计表。常用的频次表包括直方图、折线图和曲线图。由于计算机的运用,制作图表都看可以通过软件来实现,例如Excel,SPSS等软件。


  统计图是以图形表示变量的分布情况,与统计表相比,虽然不如它精确,但却更直观、生动、醒目。常用的统计表有饼图、条形图、直方图和折线图。


  2.进行复杂数据挖掘前的统计降维方法一因子分析方法。由于数据的结构有时候会非常复杂,不便于直接用来做数据挖掘。这时候需要对复杂数据进行统汁降维分析,从二简化数据结构。因子分析是一类降维的相关分析技术,用来考察一组变量之间的协方差或者相关系数结构,并用以解释这些变量与因子之间的关联。目前的因子分析包括探索性因子分析与验证性因子分析。探索性因子分析是往事先不知道影响因素的基础上,完全依据资料数据,利用统计软件,根据一定的原则进行因子分析,最后得到因子的过程。而确定性因子分析是充分利用先验信息,在已知因子的情况下检验所搜集的数据资料是否按照事先预定的结构方式产生作用。本文所讨论的是探索性因子分析,通过对数据资料的因子分析实现降维,从而为进一步的数据挖掘做准备。


  (三)需要注意的问题


  1.对数据的要求。由于大多运营商现有的面向事物的数据在质量、完整性和一致性方面存在很多问题,因此在利用这些数据进行数据挖掘之前,必须先对其进行抽取、净化和处理。


  2.对人员素质的要求。统计数据挖掘分析系统必须与实际紧密相联,在数据挖掘的多个环节中,都要求使用和分析人员不光具备数据挖掘的相关知识,还必须有对企业经营管理流程和行业背景的深刻理解。


  3.统计数据挖掘存在较长的应用周期,数据挖掘所发现的知识和规则必须让决策者理解并采纳,才能将知识转化为生产力,并通过实践不断检验和完善数据挖掘所产生的模型和规则,以使模型更具实用价值。