美国诺德斯特龙公司成立于1901年,由鞋业起家,如今已经是美国西海岸规模最大的百货零售商之一。近几年来,诺德斯特龙公司逐步涉水电子商务,作为零售商如何判定客户服务在变得更好?诺德斯特龙的Matt Fisher利用文本分析来解析在线客户数以万计的评论。这位诺德斯特龙公司的产品评价评级项目经理重拾了在微软和亚马逊工作时“爱上数据”的习惯。他在一年前加入了诺德斯特龙公司的产品管理和开发团队,目前负责诺德斯特龙网站上的用户生成内容。
在接受采访时,Fisher表示:任何我们的客户可以发表评论,上传照片,提出问题,或寻找已存在问题的地方都会被标记为用户生成内容。与此同时,他也分享了诺德斯特龙公司在处理数以万计的用户评论时所用的技术,比如Hadoop等。
问:您正在处理大量的文字或非结构化数据。你最大的障碍是什么?
Matt Fisher:我们有数以百万的来自不同区域的非结构化自由格式文本数据:其可能是顾客评论;也可能是一个提问;其可能来自于我们通过ForeSee在网络上做的调查,也可能是我们通过OpinionLab整合的网站内容;其甚至可能是来自于我们的顾客意见卡。我们正试图将所有的这些集合起来以更好地了解我们客户的想法 – 去了解那些不错或者不好领域的主题和趋势。
有个问题是:我们并没有实现这一点的企业级解决方案。因此,试图全线建立一个一致和务实的流程至今仍是个障碍。这是一个很大的组织,有很多人在不同的团队,所以衡量事情的一致性一直是个难题。
问:可否举一个不怎么好区域的例子吗?
Fisher:我正在处理的一个具体项目就是更好地确定我们物流中的问题和执行过程中的漏洞。我们在美国有多个运营中心,其中最主要的中心在中西部地区。我一直在做的就是阅读通过我们平台收到的每一个(顾客)评论内容片段,每一个“问题内容”。我们做分析,以确定它是物流还是执行抑或产品相关。我们会使用特定的标志来进行标识。
然后我们做情感分析,以确定这些客户是高兴还是不高兴。我们发现,虽然我们的一些客户并不满意,但他们却通常给产品很高的评价。但通过产品意见,他们却同时给了我们他在物流方面的反馈。
因此,我们剥离出了产品意见,并获取了执行数据,然后我们能够与我们在中西部和西雅图的执行团队进行分享。我们可以说,“似乎这个邮政编码有个趋势,这个邮递区域总是接收到裂开的快递箱子。”或者这个区域,其是价格区间的高端区域,该区域客户期望得到比现在更好的包装。
我们发现了很多这样的趋势,如果没有文本分析,我们可能永远不会得知,因为这都是些五星级的评价。表面上看不出任何问题。但是,一旦开始将其分拆开来,我们就确认了那些包含在评论中的负面情绪。
问:如何标记内容?是用手工标记的吗?
Fisher:最初,我们是用人工标记的。我和团队里的另一个同事一条条看反馈。现在我们已经建立了一个自动化的过程,基本上可以说我们可以引入大量数据到Hadoop环境中 – 全都是非结构化数据 - 我们可以通过编程方式运行,我们建立了用以在每一个集群寻找情绪的查询。
我们利用了斯坦福大学的自然语言处理(NLP)库。这是一个免费的NLP及情感分析工具集。我们可以说是每10个句子检测一次:我们可以把它拆开,并确定是否有负面的成分以及它们在句子中的位置,然后我们可以得出其是否与物流有关。然后,可以进行到下一步以2%或3%的通过率进行手动筛选。
问:如何找出包含物流相关有用信息的评论?
Fisher:我和我的团队以审核(客户评论)的做法为开始。我们使用第三方供应商作为我们审核系统的外观,他们为我们进行审核工作。因此,有算法审核组,也有人工审核组。我们试图查清什么情况会最常被第三方供应商使用的算法标记。 ......而事实上就是,我们发现了相当大数量的审核评价内容因物流被标记出来。我们发现,在去年第四季度有一个峰值,我们知道这源于天气情况。这对所有人来说都是一样的。
但是,除了这一时限,我们发现物流投诉有所上升。其中一些局限于某个特定区域,某个州,或者(更大略的)东海岸或西海岸。我们深入挖掘提出疑问,“是什么导致了这一现象?”根据我们的内容指南,我们对批准或拒绝在网站上发布哪些信息有着明确的界线。由于我们正在审查到底哪些符合我们的指导方针,哪些不符合,我们遇到了品牌商和供应商的很多与航运有关的问题。这相当令人惊讶。有些是通过我们的物流中心进行物流的;有些则是直接发货。于是我去了我们在中西部地区物流中心。在物流中心外面我跟诺斯通的执行副总裁聊了一下,我把这件事告诉了他。他认为这是一个值得挖掘的奇妙想法。
我与他的团队合作为他们打造了一种迷你记分卡。过去,他们会进行其他的指标和QA(品质保证)检查,但他们并得不到直接的一对一客户反馈,而这恰恰是反馈或者问题最核心的一面。
问:你能否解决发现的物流问题?
Fisher:某个直接发货供应商一直故技重施,其在很长的一段审查时间 - 大于12个月 – 反馈都呈现显著不利趋势。投递的物品包装盒被撕裂或本身被撕开,又或是大小错误,或左右鞋不配对,而且这种事情不断发生。其不仅限于某一个地理区域,而是全面爆发。我们负责管理这些关系的执行团队就能够深度挖掘并与供应商合作,以了解到底发生了什么事,以及如何解决。
最新情况是,我查看了那个直发供应商,其负面评论和各类货物破损或发件错误的负面信息已经显著的下降了。
问:你如何与IT部门合作?
Fisher:我们与IT部门的合作者们在任何需要硬编码或开发资源的事情上都进行密切的合作。我们每天要多次用到他们。他们在一个距离我们两个街区的建筑中。而且我们一定程度上跨团队共享相同的资源,并按轻重缓急携手合作。
问:所有团队共享同样的IT资源?
Fisher:有不同的职能团队。我的工作会与其他两个产品经理分享开发资源。我们用同样的IT资源协同工作 - 开发人员,架构师,质量保证 - 我们会共同安排优先顺序。所以说我们共享资源。