遍地都是词云,你看懂了吗?
你为什么需要制作词云,是纯粹的外貌协会,还是研究分析内容的一种表现方式,是文本挖掘技术的可视化,还是为了传播的美观便捷。
有很多在线工具提供词云生成服务,你真的读懂了词云的含义了吗?
通过一个实际的场景,带你领略一下词云的魅力······
这是一个地产公司大数据营销项目的场景:某房地产公司要为地产项目的可行性投资和营销进行前期的评估,其中一个投资项目是“大连旅游地产”。除了传统的评估方式外,还选择利用网络数据进行评估。
词云构建工作流如下:
第一步,获取数据。
对国内排名前十位的房地产公司网站和论坛、以及公司内部CRM系统内客户微博中爬取含有“大连 旅游”关键字的文章、评论和微博信息,保存为文本文件;
第二步,分词。
对文本进行分词,并进行噪声词过滤(分词和噪声词过滤可不是一件简单的事,需要不断积累和学习的过程),可以根据需要选取高频词汇,也可以通过自定义词云自动过滤低频关键词。选择高频词结果如下:
第三步,制作词云:
使用SmartMining桌面版自定义词云算法,三种不同配置,运行结果如下:
从这个图云展现出两点关键业务含义:
第一,大连旅游词云中出现很多其他城市,如:桂林、香港、海南、贵州、庐山、哈尔滨、张家界、青岛…..大家在讨论大连旅游的时候,这些同时被提及的城市可能是大连的替代品或者竟品;
第二,另外一部关键词,如:八仙过海、蓝莓谷、葡萄沟、金石滩等属于大连的描述词,说明大家在网络上讨论大连旅游的时候主要关注的内容就是围绕这些关键词,这些都可以作为大连旅游地产营销的亮点。
词云可以包含丰富的业务信息,脱离了业务的词云只是一幅华丽的皮囊。
本文由莱信学院 投稿数据分析网 发表,并经数据分析网编辑。版权归作者所有,转载此文请与作者联系。
本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。