摘要:没有人可以离开社交媒体(微信、微博、脸书等),朋友圈是维系外界最重要的通道之一,大多数人都是社交媒体的重度使用者。但是,有没有想过,我们在社交媒体上的一些无意识的行为(例如点赞、收藏、上传头像、状态更新、转帖等),其实很深层次的在暴露内心的一些秘密和隐私。
整理了一些社交媒体数据挖掘的结果,你会发现,大数据、行为痕迹和社交媒体的结合,展现了无限的机会和可能。例如,基于脸书的挖掘,可以探知你的智商、神经质、生活满意度、宗教信仰、单身与否、身材发福、产后郁郁、话题偏好和舆情监测等。
一、别轻易点赞——它会泄露你的性格秘密最近看到一篇文章,很有意思。
美国科学院院报(PNAS)最近的一篇研究表明,在社交网站上别轻易点赞,因为点赞能够泄露你一些比较私密的性格特质。基于社交网站上(例如Facebook)的点赞,可以计算出你的性格特征(大五人格The Big Five),通过算法计算的结果比你的朋友、同学、亲人判断的更准。
研究过程。具体的做法就是,作者邀请脸书上8.6万志愿者参与一项性格测试,并且收集了他们的“点赞”数据(即对什么帖子或内容发生点赞行为)。并且邀请了被试的亲朋好友参与测试,给出有关该被试性格的评价。这样就有关于被试的三份性格数据,一份是自我的评价,一份是亲朋好友的评价,一份是基于点赞数据计算的结果。研究结果表明,算法得到的性格倾向指数比亲朋好的判断更为准确。
点赞和特质。点赞的时候,我们希望向脸书好友展示我们对特定内容(包括状态更新、照片、书籍、产品、音乐)的积极态度。但是,与此同时,“点赞”行为也暴露了你很多的私密信息、敏感特质、性格偏好和行为倾向等。例如宗教信仰、政治观点、性取向和酒量等。而且,通常一个点赞(例如点赞了某一篇分享)就能够产生较为精准的预测。一些结论举例如下。
具体的,大概只需要10个“赞”,计算机就能比同事更准确的判断你的性格。通过70个“赞”,电脑就能超过其朋友。140个“赞”便超过其家人(父母亲兄妹)。300个“赞”则能“击败”你的伴侣。
二、与社交媒体有关的其他一些好玩的案例和应用
(一)你还单身吗
状态更新和单身判断。发现颜高妹子的时候,小伙伴们冒出的第一个念头,她是不是单身哈。告诉你一个福音,脸书帮你解决这个问题了。
脸书通过上百万的状态更新的数据,基于更新内容进行文本分析,识别一些特征变量,从而判断和预测用户何时从单身状态变成恋爱中状态。进一步地,脸书联合企业将研究结论进行商业应用,即向个人页面首页投放相关的产品广告。例如,向恋爱中的用户提供产品(买一赠一、情侣折扣等),或者向失恋的用户提供产品(纸巾、Ben&Jerry的冰激凌等)。
(二)内容收藏和性格判断
朋友圈,你常常会收藏一些内容和文档。其实,通过你的收藏,也是可以判断你高度敏感的个人特征的。例如性取向、生活满意度、智力、情感稳定性、宗教信仰、过度饮酒习惯、年龄、性别、种族、政治观点等。
(三)社交媒体中的好友推荐
脸书上每个人都需要上传自己的头像。基于用户的头像,脸书可以做什么事情呢人脸识别技术。
人脸识别是指,基于面部特征,分析五官的相对位置、尺寸、形状等,保存最为突出的特点,将图像数据转化为矩阵数据,以便面部识别。
对用户的头像进行人脸识别后,脸书会检索整个互联网,看看这些照片还在哪里出现过,看看是否出现在别人的合影中,猜测你可能会认识哪些人,从而向你推荐一些二度三度的朋友。
另外一方面,脸书也会将照片与公司网站、在线相亲网站进行匹配,或者从最新发表的博客或文章中寻找有关你的更多的信息。从而了解你的职业、兴趣、偏好和行为倾向等。
(四)这个陌生人是谁
谷歌眼镜和社交媒体。之前看过一个视频,描绘的就是一个小伙伴带上谷歌眼镜后,遇到一个陌生人,迅速通过谷歌眼镜找到很多有关这个陌生人的信息。想在想一想,这也是可以实现的。
谷歌眼镜需求和脸书的合作。谷歌自己开发了一套Nametag技术。基于该技术,当遇到陌生人时,谷歌眼镜通过拍照,把人脸上传,丢到脸书上进行人脸识别。从而匹配到该陌生人的职业、年龄、生日、动态、朋友圈、日志、状态和最近的兴趣等。
(五)谁是最适合的候选人
现在有些公司,借助社交媒体内容,进行潜在员工的筛选。招聘方通过个人资料,例如脸书,抓取脸书上的个人信息,基于信息和网络环境中个体表现出来的特质,判断和预测个体的智力水平和情绪稳定性。从而作为员工录用的一个参考的标准。
(六)好久不见,瘦了吗
头像变化分析。在脸书上,每个人的头像都不会一成不变的,间隔一段时间,大家就会采用新的头像或自拍照。你在进行头像更新时,脸书就在思考另外一件事,即他们通过人脸识别技术,判断前后头像是否存在差别,即你是否变胖了。
如果图像分析的结果表明,你确实发福了,恰好你的性别又是女性的话,脸书很可能就会联合一些减肥、健身、保健公司,向你的个人页面,精准的推送一些折扣券。
(七)产后抑郁症
越来越多的公司关心员工的福祉,关心员工的生活状态,并且及时的进行涉入和干预,以便你快乐工作和快乐生活。
一家公司就通过分析女性员工社交媒体上的发帖和话题(例如微博、脸书、Twitter)来判断她们是否存在陷入产后抑郁症的风险。通过抓取女性员工在生产前后几周在社交媒体上的话题和发言,摘取其所使用的动词。
分析结果表明,有抑郁症倾向的母亲常常会使用暗示“焦虑”和“不高兴”的话。发言中一般会包含一些贬义词,例如“失望”、“痛苦”、“讨厌”等,暗示着失望情绪的疯长。
(八)社交媒体和救灾路线图
2013年台风席卷菲律宾时,通过社交媒体脸书上PO的照片数据,人们绘制一幅救灾线路图。
发生灾难时,人们常常会将自己亲身经历的照片、文本、视频发布到社交媒体上。研究者们对人们上传的照片进行分析和挖掘。对于一张受灾照片,“损害程度如何通过点击按钮确定,无、中度、严重”。对于Facebook或Twitter文本信息,判断文本的类型即“寻求帮助”、“基础设施损坏”、“人口流失”、“相关但属于其他”等分类。
然后通过确认数据来自菲律宾的哪个地方,通过照片或文本发送时携带的GPS传感信息来定位,从而绘制一个受灾地图。
通过这个救灾地图,就可以得知,谁需要什么、谁需要食物、尸体在哪里、哪里有流离失所的人、哪里受到的灾难较为严重、什么医院损伤最小。从而为救灾提供了最一手、最新鲜的信息。
(九)舆情和话题监测
很多公司目前都跟在踪和监测社交媒体上与品牌相关的词汇(产品、品牌、竞争者、品牌代言人、政策趋势等),并进行情感和话题分析,了解人们在网络上如何讨论公司及其产品。
社交媒体也是一个早期的预警系统。当消费者对产品或服务不太满意时,他们会在社交媒体上吐槽,企业迅速捕捉此类信息,并且进行产品服务改良,控制负面消息的扩散和传播。
三、数字痕迹和智能生活“大数据”无处无在,“智能”非常性感。当“大数据”和“智能”勾兑和发酵,一切就变得无限可能。
通过社交媒体的这些案例,想要表达什么呢大概几点。
第一,不管你有没有意识,你的很多行为都会留下数字痕迹。文本(微博)、视频(优酷土豆等)、音频(客服电话)、图片(朋友圈)、传感器数据(手环、手机内置的传感器)等。
第二,别否认,机器和算法有时候更懂你。
第三,算法是理性的,智能是性感的。并且,算法和智能是相伴而生的。
第四,延伸来说,基于数据挖掘,计算机是能够推断出你我的心理特质的。更进一步,如果计算机能根据个人性格特质做出匹配性的响应,那么它就真的成为具有情感和社交能力的智能产物了。
不知道大家是否看过电影《她Her》、《机械姬Ex Machina》(注:年度科幻电影排名前五),《她》里面基于人工智能虚拟的Dream Girl,绝对是你完美的伴侣。
第五,最后一点也是最为重要的一点,好歹我也辛辛苦苦梳理了这么多的资料,看完记得点赞哈。
本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。