在信息化时代,网络舆情对于企业来说如一柄时刻悬在头顶的达摩克利斯之剑,稍有不慎就可能给品牌或产品带来巨大的负面影响;而业界流传的无数公关失败案例已经反复证明,在舆情管理领域,事后弥补往往为时晚矣,而缺乏技术支撑的管理又让人无从着手。本文从舆情的信息采集、预警等方面入手,告诉你如何搭建起完整的舆情管理体系。
如果你不相信舆情的重要性,就去看看近日沸沸扬扬的离婚案主角——某男星前妻的微博评论吧。
也许你认为,寻常网友的评论于当事人无关痛痒,但假设将来当事人想要拍电影,却一无投资人二无观众,恐怕也是顺理成章的结果。
舆情,是“舆论情况”的简称,指在一定社会空间内,围绕社会事件的发生、发展和变化,民众对社会管理者、企业、个人及其他各类组织及其政治、社会、道德等方面的取向产生和持有的社会态度。它是较多群众关于社会中各种现象、问题所表达的信念、态度、意见和情绪等等表现的总和。
信息化时代,我们越来越深地感受到舆情、尤其是网络舆情的影响力,尽管可能未必意识到。外出聚餐之前,你会打开大众点评、参考过往食客的评价,而APP上一条条打分和评论正是一种舆情;买车、买家电之前,你也会浏览相关网站,或者在微博上搜索一番,看看某品牌或款式的评价如何,负面反馈多不多,这些评价和反馈也正是一种舆情。有时,一个低分、一条关于售后服务的消极评价,不但可能彻底打消你个人对品牌或企业的全部好感,甚至可能经过发酵、大量传播,成为众人关注的一时热点,以至于企业不得不花费巨大成本,采用公关手段力求挽回。
当然,公众形象始终是一件与其亡羊补牢、不如防患于未然的事情,因此舆情产业已经深入政府、媒体、教育科研、软件等行业。大量舆情软件公司和市场调查公司高速发展,以抓取网络舆情数据为基础技术,成为舆情服务业重要的技术型方阵。截至2012年1月16日,全国共有约68款经过工信部软件司认定登记颁证的“舆情”软件,市场上还存在大量未经认证的同类软件。
目前,舆情分析机构主要提供的服务覆盖了从舆情监控分析到研判、预警,再到提出应对策略;舆情管理已经从简单粗暴的媒体宣传,发展成更为精细化、全面化和专业化的运作,网络舆情分析包含舆情信息采集、舆情事件预警、舆情智能分析与应对策略和舆情报告等多方面综合分析。
舆情信息采集是舆情分析的基础工作,需要对网络上的舆情信息进行分类和扩展,从深度和广度两个方向采集,满足后续分析要求。舆情事件预警则需要对热点事件进行深度剖析,持续跟踪热点事件,分析事件发展趋势,对事件进行监控并及时告警。舆情智能分析与应对策略可以帮助企业对从企业形象、产品口碑和舆情事件进行深入分析,对影响舆情的因素进行多角度判断,倾向性分析与统计,提供应对策略方向以及策略收益分析。
舆情分析可以实现什么?
当前的舆情分析市场中,现有软件厂商和传媒科研机构各有所长,他们在政府部门的舆情分析中发挥着重要的角色。然而,这些厂商或机构往往注重信息采集,但收集了海量信息后,却在利用大数据技术进行信息分析的思维方面有所欠缺。
作为由数据专家、建模专家和业务专家组成的团队,KPMG大数据团队认为,对海量信息的处理和分析才是舆情管理中的重点,而在掌握信息的基础上,我们可以完成的工作包括:
1.舆情事件预警
舆情事件预警主要包含三个重要功能:
其一,对整个网络舆情进行监控,及时甄别最新的舆情事件,有助于事件及早发现,及早处置;
其二,对热点事件进行实时跟踪,对事件热度进行综合评分,设置预警线,实时告警;
其三,探查事件热度拐点,分析拐点背后原因,寻找事件意见领袖,研究意见领袖对舆情的影响;
其四,分析事件热词,识别热词倾向性。
2. 口碑管理
口碑管理的关键在于,通过网络舆情数据,分析展示市场对于该品牌的形象描述,对比企业自身的期望,分析差异原因。在掌握数据的基础上,我们赢对企业现有的宣传策略进行诊断,对比各大宣传平台PV访问量、UV访问量等信息,针对各个宣传平台中企业形象信息,分析宣传收益。以期指导企业根据分析结果,适当调整宣传策略,以达到最好的宣传效果。从产品、时间、地区、等维度分析口碑变动情况及热词分布,对热词进行情感判断,识别口碑及热词倾向性。企业可针对分析结果,采取针对性的销售策略,也可以针对反馈集中的问题对产品进行优化。
那么,在认知了概念的基础上,要如何实现有效的舆情管理呢?
技术解决方案:如何实现舆情管理?
无论采用什么方法或技术,最高形态都是完整的系统,因此搭建舆情分析系统是最有效率的舆情管理手段。
舆情分析系统分为三个主要模块,舆情信息采集、舆情分析引擎和舆情应用。舆情信息通过舆情采集模块流入舆情分析引擎,分析引擎负责数据加工处理、分析舆情信息,最终分析结果通过舆情应用展示,分析过程中的数据分别存在舆情数据库和查询索引数据库。
1. 舆情信息采集:爬虫技术
舆情信息采集的基础在于,使用当前十分成熟的网络爬虫技术,对指定网站的数据进行爬取。目前,网页信息的抓取策略主要可以分为广度优先、最佳优先和深度优先三种。由于深度优先经常会受到限制,所以在团队实践中,我们主要采用广度优先和最佳优先,部分数据采取深度优先策略。市面上的开源网络爬虫工具多达100多种,他们各有所长,而我们以Python为主,以其他开源软件为辅,从网络上抓取所需信息。另外,需要注意的是,现在大多数网站都采取了反爬虫技术,我们在搜集数据时,还需要使用多种技术手段对付反爬虫技术。
2. 舆情分析引擎
应用爬虫技术抓取的数据,通过一系列ETL过程,存储在本地系统中,使用SAS、R等工具对数据进行分析挖掘。对关键词进行情感分析和综合评分,标注关键词的事件、时间、地区、关联用户、关联词等信息,计算该词的频率,在同一事件中的占比等等数据。
3. 舆情应用
下面以汽车行业为例简单介绍示例展示舆情系统的应用界面,具体展示内容可以依据客户要求进行定制。
a. 口碑管理
图1是我们通过舆情分析得到的品牌形象,可见该品牌留给消费者的印象主要是“安全”和“适合成功者”;假如企业期望的品牌核心形象为安全和时尚,可见两个形象存在一定偏差,企业需在宣传策略上做出一定调整。
图1
“声量诊断”也具有重要的参考价值。我们分析其宣传品牌文化的渠道和平台,比较各个平台的PV访问量(页面浏览量)和UV访问量(通过互联网访问、浏览这个网页的自然人数量),以及赞同数(图2),然后再比较各个平台间品牌形象的差异。
图2
“口碑变化”帮助我们分析展示各类产品的口碑变化趋势(图3),其中红色代表较上期下降,绿色代表较上期增长,可以点击任意立柱链接到图4。图4展示当期影响口碑的热词,热词大小代表权重,如频度、浏览人数和支持人数等;颜色代表倾向性,红色代表负面倾向,蓝色代表正面倾向。另外,系统还支持地区间口碑对比(图5)。
图3
图4
图5
b. 舆情事件预警
舆情监控系统采用准实时跑批和手动跑批两种方式,实时把握网络热点事件动向,如图6所示,针对2012款速腾进行全网搜索,通过模型算法计算当前热度值,并展现热词情况,仪表盘指向红色部分,热度值已超预警值,系统告警。热度值计算方法采用声量加权重的方式,微博的声量为V,权重系数为v,微信的声量为W,权重系数为w,新闻网页的声量为D,权重为d,搜索引擎的声量为S,权重为s,热度值为H=v*V+w*W+d*D+s*S,权重系数由客户和咨询方商议协定。市场主流的权重系数为,v=0.15,w=0.4,s=0.25,d=0.2。其中,热词的大小代表热词频度,根据语义分析判断倾向性并以颜色标出,蓝色代表正面倾向,红色代表负面倾向,灰色代表无倾向。图中折线代表该产品热度随时间变化趋势。
图6
图7
图7对舆情事件趋势中任意时间点进行钻取,分别对其倾向性、职业、收入、网站、平台、性别、年龄段、学历和城市类型等不同维度,展示各个人群对此事件的情感倾向性。就这样,我们的舆情管理系统的主要功能已经搭建成功了。
舆情管理大约算是一项新兴产业,但舆情绝非一种新鲜事物,每个人一直都有很多话要说、很多观点要发布。就在我们发布这篇文章时,打开微博、微信或任何较为流行的媒体平台和论坛时,明星、品牌、企业、热点……仍在一刻不停地经受舆情的考验,而成功或毁灭往往就蕴含在每一段文字中间,可能无法预测,可能难以控制。
然而归根结底,舆情仍是一种信息、一种数据。
在网络上,无数未能掌握舆情管理的品牌或企业眼看着自己一步一步被无序的舆论之海淹没,最终窒息。然而,只要成功运用了舆情管理的思维和方法,舆情的数据流就是有规律的,是可以预测、甚至可以调控的:每一条舆情言论,都可能是企业塑造形象的契机。
本文为专栏文章,来自:KPMG大数据挖掘,内容观点不代表本站立场,如若转载请联系专栏作者,本文链接:https://www.afenxi.com/26296.html 。