企业如何利用情感分析提升价值
Posted by 584wukong | Posted in 社会化媒体 | Posted on 23-04-2010
标签:social CRM, 社会化关系管理, 社会化媒体, 自动化情感分析
3
在博客时代,自动的情感分析已经成为争论的焦点。如何达到精准?方法论是什么?什么样的内容是对企业或品牌有用的?如果实施正确,情感分析将会十分有用。在这篇文章中,我将解析情感分析的过程、内容,并且提供一些具体的企业应用案例。
什么是自动化情感分析?
Wikipedia给出情感分析的定义是“为了判断说客或作者的态度的过程”。自动的情感分析通过自然语言处理技术(Nature language process
ing)教会计算机识别情感。多种情感分析平台测量方法使用不同的技术手段和统计方法去估算网络中的情感。一些声称能够实现100%自动情感分析的企业,一些采用人工手段,一些则采用两者混合手段。
任何自动化的平台首先必须被训练正确地识别情感,并且做这些的方法相当多。在biz360(译者注:作者的公司),我们使用machine learning(机器学习)的方法训练系统,基于创建在Amazon的Mechanical Turk上的注释,这基本上意味着训练数据集中的每个术语首先被人工注释。
自动化情感分析永远不会和人类分析一样准确,因为他不会考虑到微妙的讽刺和肢体语言。然而根据我们利用mechanical Turk的经验,通常达到79%的正确率,这意味着,即使自动化情感分析的精度远低于完美,但在统计上,这可被认为比人工分析精准。或者说是和人工分析一样精准(译者注:人工分析中会存在较大误差)。
自动化情感分析何时有用?
如果你有1-10篇文章,最有效的方式是阅读他们。但是如果你有50,000篇文章呢?这时候自动化情感分析就会为进一步的分析给你提供一些方向性和论调上的洞察。
情感分析与其他因素一起考虑时是个很好的度量,但如果你只考虑情感分析会是个欠考虑的人。不管和什么一起度量,文本总是最重要的,然后是人们驱动策略的洞察。
比如我们在biz360上建立了一个 IdolStats项目,我们在这个项目中基于情感分析,预测美国偶像参赛者每周会获得的投票情况和这些人在社会化媒体上的声势。由于我们同时考虑情感和声势两个因素(还有相对于前一周的趋势),所以我们会做出比单独情感分析更准确的预测。
我们经常讨论品牌健康相较于竞争对手在社会化媒体上的表现。如果你有20%的负面信息,这很糟糕么?答案是,看情况。但如果你看到你的竞争对手有50%的正面,10%的负面,而你是20%负面,这也许值得去研究驱动这些观点的因素。
你应该揭开一些短语,比如“bad quality”“crashes too often,” 和“won’t start.” 的含义。这会影响你的产品设计、顾客服务、营销信息和社会化媒体深入度。你能发现是否有特定因素驱动负面讨论并做一些事情影响他们么?
在趋势线上捕捉情感信息,以至于你可以发现突发的正面或负面言论的峰值,这也许是值得的。情感分析对结构化未来的信息是个不错的起点。
我们找什么?
如果你决定自动化情感分析对于社会化媒体度量和检测工具箱是个明智的选择,当你决定要把情感分析与工作融入一起的时候,下面是你应该需要考虑的方面。
解析精度
正如上面我提到的,机器永远不会达到人类的正确率,即使是人类也会对分析结果产生质疑。情感类型的数量也是等式的一部分。一些平台提供三种情感类型,一些提供四种,还有提供5个或更多的。你建立越多的类型,你得到的结果越不准确(但是会得到丰富的信息)。
分离文本类型
很多社会媒体内容是中性的(biz360的引擎团队评估结果大约是60%),一些社会化媒体可能会有更大的中性言论范围。比如相对于其他媒体,在twitter上中性言论的比例就更大(可以这样理解:”我刚喝了一杯咖啡“,或“午饭时候吃craving tacos,谁来?”,或“苹果发布了ipad平板电脑”)根据你关注的信息来源,你的情感分析结果会不同——这应该是可以预知的。最后,确定你的情感分析平台允许你按内容类型分离结果。
情感废除
由于自动化情感分析不是100%的准确,你,用户,需要一些废除控制。当选择一个工具的时候,确保它允许你废除情感和不相关的结果。
主体级别 vs 文章级别
直到最近,这个产业标准已经可以在文章级别测量情感了。过去,一些平台开发出了基于主体级别(主体级别分析可以测量文章内一个主体或多个主体的情感态度,甚至是整个文章的情感态度不同)的多种方法。比如,我是Gowalla的社区经理,我正在读一篇关于地利定位服务的文章,它可能包括三个不同主体的情感态度:Gowalla,Foursquare,和整篇文章的论调。如果我是Gowalla的人,我可能会想要知道所有这三个主体的态度,但是更关心对于Gowalla的态度。
情感分析之后
成功参与的关键在于情感分析优先化处理:
1.影响
由于社会化媒体覆盖广泛,优先处理工具持续进化。关于你品牌的10,000个blog文章和tweets中,你如何挑出最受关注的50个?如果你需要将最伤害你的品牌的话题中立化,你需要深入负面言论,确定最具影响力人的来源,了解每个tweet传播的轨迹,并且有多少人被这个内容所影响。如果blog和tweets是同样的负面言论,你如何解释?你如何量化来自同一个人的跨平台沟通的交叉效应?包括评论分析人士正在成为社会化媒体监测行业的标准。
2.声誉
进一步考虑影响力概念,每个重要的用户都应该有社会化媒体声誉档案。如果一个人的负面言论指数高于平均值(比如这个人每个东西都讨厌),然后这个人的负面言论应该被低估——从统计上来说,我们要抛弃那些外行人,比如我们考虑范围之外的人。还有,在某个渠道上的声誉和影响应该可以被迁移到另外的渠道。
3.强度
一旦涉及情感分析的算法,成功的优先处理过程就会认证每个言论的强度。“我真的讨厌某产品,并且永远不会买它”是非常不同于“某产品今天有点糟糕”的。处理每个社会化媒体言论的交叉引用强度,影响力,轨迹,速度和情感的能力都将驱使我们走向可信赖的优先级体系。
社会化关系管理(Social CRM如何绑定所有环节)
社会化关系管理的定义,目的是丰富每个对话,通过多种渠道加深用户参与。Social CRM最理想的结果是可以关闭大众情感,互动,购买意图,最终的产品购买之间的分析循环。
你可以想象如下情景:
- 深夜你被社会化媒体的负面信息惊醒
- 深入理解言论态度并发现最负面的言论
- 优先处理负面言论和挑选出50个最有影响力的内容
- 探究负面tweets从何而来(博主),并如何迅速蔓延
- 读一下这个人的blog,研究博主遇到的产品问题
- 在博文下留下最真诚谦逊的评论,利用媒体回答疑问
- 私底下约博主,进一步了解解决问题的方法,然后去实施
- 上面所有的信息都会记录在博主名字命名的事件中,这允许你最终事件过程(译者注:指在CRM系统里记录这次事件发生的相关信息)
- 因为你有了这个人的历史记录,并且你的系统是交叉引用他或她的跨平台社会媒体档案你可以追踪这个人对你品牌的态度,监测他们的购买意图,并且关注他们对其他人购买决策的影响
原文作者 @themaria
网址:http://mashable.com/2010/04/19/sentiment-analysis/
译者:我不是悟空
本文地址:http://www.socialbeta.cn/articles/sentiment-analysis.html
更多社会化媒体相关内容,请订阅SocialBeta。
欢迎转载,请保留以上信息.




