为什么说今日头条的大数据个性化定制就是个噱头?

今天我们就温柔地手撕一下国内目前装逼最成功的媒体之一,「今日头条」。

01

搜狐、新浪、腾讯、网易,这四大传统门户的新闻版块虽然日趋式微,但余威尚在。而「今日头条」从2012年上线至今不过短短3年,用户量已经突破3亿。中国网民总量不过6亿左右,几乎每两个人就有一个在用它。

「今日头条」的巨大成功,显然不是「正面刚」的结果,而很大程度上得益于它的差异化定位:基于用户兴趣和数据挖掘的个性化新闻推荐。

现实生活中,大部分新闻都是垃圾,所谓的热门你又可能不感兴趣。报纸洋洋洒洒好几页,你真看的也就几个豆腐块儿,很浪费时间。怎么办?个性化推荐。根据你自己的独特喜好,从海量数据中挑选出你真正关注的内容,大大节省你的时间。

比如同样是娱乐新闻,我就只想看我们家邓超,别的一概不关心,哪怕是娘娘相关的也不看,推都不要给我推。完美。

然而,理想是丰满的,现实是骨感的。目前「今日头条」上被推荐最多的新闻,除了所谓的全民热点外,基本上主要是一些情色擦边球。

为什么说今日头条的大数据个性化定制就是个噱头?

(图片来自微博)

我自己也试着刷了几次,有些新闻标题看起来真的是low得不要不要的:

俄罗斯富三代街头花1万卢布引诱妹子进奔驰脱光抚摸

孪生姐妹共侍一夫让父母害臊

实拍男子与情妇车震被老婆抓现行

原配死死揪住正在和老公逛街的小三

他闻妻子内衣后怒告其通奸

为什么说今日头条的大数据个性化定制就是个噱头?

(图片来自今日头条)

对「个性化推荐」有所了解的盆友马上就说了:这些内容都是根据你的喜好推荐的,你之所以能看到黄色新闻,完全是因为你经常看黄色新闻。是你自己不要脸,跟人家「今日头条」木有关系。说得好,友情送一个截图梗。

为什么说今日头条的大数据个性化定制就是个噱头?

(图片来自《傲骨贤妻》,侵权就删)

实话实说,光看这些羞羞的标题,我还真是想点开看看呢。可惜作为一个资深标题党,我深深地明白点开后面对的不过是内心无尽的空虚。

而且作为一只严谨的产品狗,我为了避免智能算法误会我的人品,我真的是一条都没点开过。这一点,我已经成年的老婆可以作证。那些自认为特别正经的同学,不妨亲自打开「今日头条」刷新几下看看。

不过话说回来,哪个新闻客户端不推荦段子活跃气氛啊,号称「有态度」的网易不也满屏的都是「女性高潮那点事」「明星为何爱劈腿」「富豪跑车睡嫩模」「老婆怀孕就出轨」么?网民就是喜欢看呀,没办法。

但问题不在于情色,而在于「今日头条」主打的是「个性化推荐」。为什么根据用户的偏好精准定制之后,看到的仍然是铺天盖地的情色内容呢?

一言以蔽之,因为媚俗。

02

王婆自己吹嘘得再凶,瓜甜不甜还是要买的人说了算。「今日头条」为了吸引并留住大量用户,就不得不走媚俗的路线。

作为「今日头条」的核心竞争力,做好个性化推荐系统需要关注两个方面:一是提升用户的客观行为指标,比如推荐新闻的点击率。二是提升用户的主观满意度,即让用户觉得推荐结果更靠谱。简单来说,就是既让用户喜欢看,又让用户感觉爽。

先说客观指标,怎么让用户喜欢看。

什么样的新闻点击率高?

用户个人感兴趣的。

用户自己对什么内容感兴趣?

还不知道。

不知道用户对什么感兴趣怎么办?

先推荐一批试试看。

先推荐哪一批呢?

其他用户比较喜欢的。

其他用户普遍比较喜欢什么呢?

色情的。

因此机器学习最大的坑:

就是俗称「马太效应」的现象。

豆瓣推荐电影、亚马逊推荐图书,都会有一个比较长的时间去积累足够的用户数据,从而优化推荐结果。

但新闻是一个时效性非常强的东西,转瞬即逝,在推荐时很难针对每条新闻去做计算,只能把主题相似的新闻都看成是同一类。你喜欢看广州女大学生援交,那你估计也喜欢看双胞胎姐妹双飞,嗯。

可有人会说,如果你是个正经人,那你一开始有本事别喜欢看援交啊,你看点别的新闻不好嘛?说得好,看一下「今日头条」的推荐列表。来,正经人,说实话,你会打开哪一条?

为什么说今日头条的大数据个性化定制就是个噱头?

(图片来自今日头条)

媚俗并不是推荐系统的错,特别是在一个全民都俗不可耐的社会环境里。在这种前提下做新闻的个性化推荐,哪怕满屏都是lowB情色也是可以理解的。

但相比于「今日头条」吹嘘自己算法多牛逼,新浪微博的自黑精神就显得非常可爱。用户发现「你可能感兴趣的人」并不感兴趣,怎么办?不妨男的统一推荐美女用户,女的统一推荐美妆博主。

为什么说今日头条的大数据个性化定制就是个噱头?

(图片来自微博)

当然上面这图只是在开玩笑,却也能说明所谓的「个性化推荐」在实践中并不像理论上描述得那么简单好用。

「非装逼勿看」

稍微装逼一点来说的话,比较了解recommendation system的盆友可能会提到:

评价algorithm的指标除了accuracy还有一个很重要的是serendipity,留出一部分固定的机会去推荐用户可能不那么感兴趣的新标签来试错,就能解决机器学习中过拟合over-fitting的问题了。

可惜在data sparsity这么严重的cold start场景里,explore & exploit平衡到底能有多大作用其实是很令人怀疑的。

何况保证推荐结果多样性就需要扩大召回率,这往往以牺牲准确率为代价,在提高推荐点击率KPI的驱使下这种努力在实践中很难不被掣肘。

再说主观指标,怎么让用户感觉爽。

「用户体验」是一个非常虚幻的概念,很难界定。

好在心理学上对「用户满意度」有过一个比较直白的操作化定义。一共是3个问题?

你觉得是否满意?

你下次是否还愿意用?

你是否愿意推荐给朋友?

回答的肯定程度越高,满意度越高。

而关于个性化推荐系统的用户满意度,有过两个比较有趣的心理学研究。以下描述仅说明逻辑,细节不保证完全一致。

研究一:

告诉你「谁推荐的」,

比「推荐什么」更重要。

让所有人分别对一份完全相同的电影列表评分,然后把参与者随机分成3组,根据他们每个人的喜好来推荐其他影片。

第1组人得到的推荐是基于电影热门排行榜给出的,第2组人是专业影评人给出的,第3组人是人工智能算法给出的。

结果不出意外,第3组人的满意度更高,认为推荐结果更符合自己的品味。然而现实是残酷的,实验人员给这3组人反馈的所谓推荐结果,不过是同一份随机生成的内容完全相同的电影列表而已。

研究二:

告诉你「为什么推荐」,

比「推荐什么」更重要。

和上一个研究类似。先让所有人分别对一份完全相同的音乐列表评分,然后推荐系统会根据用户的偏好进行推荐。

参与者随机分成2组,第1组人只能看到推荐结果,第2组人的推荐结果上还附有推荐原因。

结果显示,虽然使用了完全一样的推荐算法,第2组人的满意度却显著高于第1组人,他们觉得附有原因的推荐结果,看起来更可信。

在明白了人类的有限理性是多么容易被扭曲之后,再回到「今日头条」的例子:

它为什么要在推荐结果明显不理想的情况下向用户抛出「个性化定制新闻」的噱头?

因为有些心理错觉,并不是你说破了就会失效。恰恰相反,这些小伎俩必须得说出来,才会奏效,所以才更要说出来。

可是冒着被打脸的风险,推着满屏幕的low文,还硬是要宣称自己走的是「个性化推荐」的高大上路线,到底图什么呢?

一言以蔽之,为了钱。

03

业内数据,「今日头条」年收入是十亿量级,其中约90%来自广告。而广告费中有一半以上,来自两个土豪行业:地产、汽车。这俩行业广告商的主要特点,一是人傻,二是钱多。

钱多容易理解,大宗商品交易,流水动辄千亿,从牙缝里剔出来一点儿肉丝,就够互联网各大媒体吃好几年了。而说人傻,并不是真傻,只是对所谓的互联网广告没那么懂,也没那个动力去弄懂,反正不差钱儿嘛。

今日头条吸引用户的招牌是「个性化推荐」,完全一样的逻辑,到了广告商这里,忽悠的术语就成了所谓的「千人千面」。特别形象,以前是所有人都看一样的内容,现在一千个观众心里有一千个哈姆雷特。

用户看到的都是自己喜欢的内容,包括广告也是个性定制的,爽了。

您投放的广告都展示给您的目标受众,不用花冤枉钱,爽了。

我们通过自己的技术提高资源的变现效率,赚点广告费,也爽了。

三赢啊。

土豪一听,来吧,拿钱砸死你,数钱到手软。至于到底做得多好呢?土豪们其实没那么关心。天天在央视投广告的那些金主,他们会操心这一个亿砸5秒钟广告出来,公司利润到底能上升几个点嘛?根本不会,也没法衡量。

微信朋友圈广告,那逼格够高吧,真的是小母牛坐火箭,牛逼上天了。憋足了劲玩儿饥渴营销,真能给广告商带来什么实际效果么?不知道。但肯德基今天上了微信,你要是麦当劳,你上不上?你麦乐鸡块要是不上,以后在上校鸡块面前,还怎么做鸡?

今日头条也是一样,概念炒热了,故事讲圆了,身段提高了,牌子打响了。众人抬轿,水涨船高。实际上做成什么水平,反而不那么重要。

一来你不懂,你也不用太懂。二来别人肯定比我还差,我也不用做多好,就已经真的是出类拔萃了。实际上哪家新闻客户端的信息不是筛选过的啊,但农夫山泉先说了自己有点甜,别家再说就没劲了,还显得怪不要脸的。

市场上占先机,远比技术实力上真有什么过人之处,更重要。因为大部分人都是外行人,他们不懂也体会不到技术,而只会为营销手法买单。并不是说内在实力不重要,而是说占了先机的人起码还有机会修炼内在,而那些闷头只修炼内功的兄弟,可能没等出关就饿死了。

所以从这个角度来说,「今日头条」的商业运营思路,还真的是既合理又有效,所以能取得现在的成功,也就顺理成章了。

04

好了,花了5分钟,看了将近4000字,这厮都说了点啥呢?

1、「今日头条」所谓的「个性化新闻推荐」基本上是噱头大于实质。

2、它这样做,主要是为了抬高自身媒体价值,从广告商那里忽悠更多钱。

3、而它越是宣称个性化定制,大部分傻白甜用户就会越觉得定制结果个性化。

完毕。

来源:科学家种太阳

本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。

(0)
大数据精选的头像大数据精选编辑
上一篇 2015-12-16
下一篇 2015-12-18

相关文章

  • 2017第二届北京大数据及云计算展览会(2017年8月10-12日)

    2017第二届中国(北京)大数据及云计算展览会

    2017-04-12
    0
  • 不仅要清楚如何收集数据,还要清楚如何创造数据

    导读:企业每天都受到大量信息的冲击。这些信息由邮件、社交媒体、网站和移动应用等等生成,来自于它们业务的各个方面。 业界估计数据每年的增长率在30%到50%之间,对于许多企业来说,每年将增长上PB的数据量。问题显然不是缺少数据,而是缺少“正确”的数据。 根据埃森哲近期的调查显示,仅40%的管理者认为他们现有的分析应用能够识别有效数据,只有20%对现存分析应用支…

    2013-11-03
    0
  • 数据挖掘化功大法(4)——数据挖掘涉及的技术

    数据挖掘需要掌握的内容包括:统计学、机器学习、模式识别、数据库和数据仓库、信息检索、可视化、算法、高性能计算等。 下图比较清楚的画出了学习数据挖掘需要掌握的知识内容: 1、统计学 统计学是通过搜索、整理、分析数据等手段,以达到推断所测对象的本质,甚至预测对象未来的一门综合性科学。其中用到了大量的数学及其它学科的专业知识,它的使用范围几乎覆盖了社会科学和自然科…

    2015-01-04
    0
  • 《Gartner2019年BI及分析平台魔力象限》的深入解读

    在本报告里,Gartner预测了2020年BI行业的发展趋势,定义了现代型BI的5个评选用例及15大功能,并给出了入选魔力象限的厂商,可谓几家欢乐几家愁。

    2019-09-21
    0
  • 如何从零构建实时的个性化推荐系统?

    现在网上到处都有推荐。亚马逊等主流电子商务网站根据它们的页面属性以各种形式向用户推荐产品。Mint.com之类的财务规划网站为用户提供很多建议,比如向用户推荐他们可能想要办理的信用卡,可以提供更好利率的银行。谷歌根据用户搜索历史记录的信息优化搜索结果,找到相关性更高的结果。 这些知名公司使用推荐提供情境化的、有相关性的用户体验,以提高转化率和用户满意度。这些…

    2016-01-04
    0
关注我们
关注我们
分享本页
返回顶部