美国政府:小规模用数据分析反欺诈
2013-03-19 作者:CIO发展中心 MaxTian
大中小
【CIO发展中心独家】谁拥有的大数据最多?肯定是美国政府。政府补助、医疗保险、员工赔偿、上市公司财务数据,还有人口数据等等。通过整合和利用这些数据,造福美国大众的方法很多,但政府似乎刚刚才开始摸着一些皮毛。整个政府机构内有各种不同的分析项目在建立,但其规模有限,也很少与其他机构分享各自的经验教训。
不过部分政府机构正在推进一些内部分析项目。到目前为止,主要目标是反欺诈和阻止不当付款,防止政府错误地支付过多资金,或作出不应有的支付行为。这一点也不奇怪,奥巴马政府正在致力于减少政府的舞弊和浪费。
尽管针对的是不同类型的欺诈,不同机构采取的方法却是类似的:建立一种模型,以识别异常和可能的欺诈性索赔。分析工作必须在支付前完成,而不是以往"先付钱,再追踪",依靠审计来识别欺诈的马后炮方式。随着潜在的欺诈行为被认定和确认,相关信息被输入到系统中,进一步优化预测算法。
避免经济刺激计划相关的欺诈
其中一个较为高调的反欺诈项目,由"经济恢复问责和透明度委员会"(RATB)主导。该委员会根据2009年美国政府的经济刺激计划,依照《复苏与再投资法案(ARRA)》建立,其任务是双重的:公布(在Recovery.gov网站)8000亿美元的经济刺激基金在何时、何地,被用于何种用途,防止其中2830亿美元的合同、补贴和贷款金额遭受欺诈和不当支付带来的损失。
上述第二种任务,就是预测分析介入的原因。委员会建立了数据分析团队,称之为"复兴运营中心"(ROC),由后者设计一个系统,对补贴接受者提供的信息和其它22种以上不同来源的数据集进行对比。其中有些是政府数据,包括由于欺诈、虚拟陈述或业绩不佳,被暂停参与政府合同的机构名单。其他数据包括商业或者开源渠道的数据,来自Dun&Bradstreet、Lexis-Nexis、GPS数据源或社交媒体,包括Facebook及Twitter。
ROC的员工借助关联分析工具来发现需要进一步调查的"潜在关联"。如:某个被监控公司的主要负责人,可能同时也是另外一个法律实体的代表人。由于分析本身侧重于预防,而不是发现欺诈的事实,很难对其结果进行量化。截至2012年11月底,总额2830亿美元中,遭受的欺诈损失只有2780万美元。
发现医疗保险欺诈行为
防止医疗方面的欺诈,是美国"医疗保险和医疗补助服务中心"(CMS)的重点项目。根据2010年"小企业法"的规定,该中心在2011年6月建立了旨在防止医疗保险欺诈行为的预测分析系统。该中心的负责人员称,CMS的反欺诈系统每天要过滤450万条医疗保险索赔数据。反欺诈系统与自动化供应商筛选系统(APS)配合工作,对供应商提供的数据和政府公布的供应商信息、授权凭证、犯罪记录和社会保障数据进行交叉检验,确保每个供应商在所服务的地区获得了有效的执业许可,而且未被罚款或限制,也不存在使用被盗社会安全号码的情况。CMS还对信息进行地理标注,以确定供应商的地址上是否存在合适的办公设施。
根据2012年12月CMS发表的进度报告,第一年中该系统发现的新欺诈案件超过500条,另外还发现了与以往500件欺诈案有关的新证据,避免了1150万美元的不当付款。
报告中提到,CMS的分析确定某个供应商为高风险,其80%的医疗保险报销属于"高度可疑",该供应商为每位患者提供的服务,超出了同类供应商的水平。经过CMS证实,患者并没有收到这些服务,向该供应商的付款也被中止。CMS表示,该系统的投资回报率很好,每花费1美元,就可以节省3美元。
USPS对抗欺诈的四种方式
美国邮政服务的监察长办公室开发了一套预测分析系统,以应对四个不同的领域中的问题:合同诈骗,员工赔偿诈骗,金融诈骗和邮件失窃。"风险评估资料库系统"(RADR)对内部和商业数据进行合并,以形成风险分析模型。
去年9月,美国邮政总局发言人表示,其用于过滤员工赔偿的系统挽回了950万美元的损失。
绊脚石
不同政府部门已开始进行相关领域的合作,RATB已开始通过一些试点方案,向其他机构提供防欺诈服务。然而根据法律它将在2013年9月30日解散。奥巴马政府已经建立了另外一个委员会,"政府问责和透明度委员会"(GATB)来研究RATB的系统和流程,以及如何继续在政府范围内加以使用。然而,业界人士认为GATB仅仅是纸面文章,如果没有具体的实体来接管RATB的工作,相关的知识就会流失。
美国邮政(USPS反欺诈的四种方式)开发的系统可以方便应用于其他机构,为什么美国政府不能确保所有机构采用同样的分析系统?不同机构的积极性各不相同。
(来源:CIO发展中心)