【引言]】这是在 Xtecher 大数据微信群里做的一个分享,感谢高琳记录整理。
大家晚上好,很高兴能够有机会做这次分享。我今天分享的内容是如何成为数据驱动型公司。我看到今天这群里有一些是投资人,还有一些本身就是数据从业者,光 CEO 就有好几个。今天我讲的内容有可能还是比较基础一些,希望起到抛砖引玉,促进大家一起探讨。
一、什么是数据驱动
先看一个故事。秦朝末年的刘邦、项羽,当时都是起义军。最早是刘邦先打到了咸阳,但他没有烧杀抢掠。他手下有一个谋士,就是大名鼎鼎的萧何。萧何做了一件事情,就把丞相、御史家里的书和地图之类都收集起来了,然后他们撤出了咸阳。后来过了几个月项羽来了,那就是烧杀抢掠,把阿房宫也给烧了。之后项羽分封各路诸侯,刘邦被分到了四川,也就是巴蜀之地。那个时候萧何经过数据分析,发现了一个特点。就是在汉中那个地方,在当时秦国的偏南一点,巴蜀北边。地方不大,但是占秦国的税收比例还挺大的。萧何就劝说刘邦,让刘邦找找人把这个地方分给他们。刘邦还真找到人了。当时项羽就觉得这个地方偏而且不大,反正也没多大关系,就把汉中给了刘邦。刘邦就是在汉中之地集结力量回击的,几年之后把项羽给搞定了。
我们可以看到古代也是这样,会数据分析的人和不会数据分析的人,差距还是很大的。萧何会数据分析,帮助刘邦做出了关键的决策。而像项羽这样不会数据分析,最终导致亡国都有可能。
(图 1 楚汉争霸图,来源于百度图片)
我们接下来说为什么要做数据驱动。其中数据很大的价值就是:驱动决策。大家平时做一些讨论,讨论什么事情该做不该做,项目怎么样,许多时候是凭感觉来拍脑袋的。这种方式有可能拍对,有可能拍错。更好的方式要靠数据来驱动的。比如,一个产品的界面,到底绿色背景好还是蓝色背景好,从设计的层面考虑,是都有可能的。那我们可以做一下 A/B 测试。可以让50%的人显示绿色背景,50%的人显示蓝色背景,然后看用户点击量。哪个点击比较多,就选择哪个。这就是我们讨论的数据驱动。这样就转变成不是拍脑袋,而是通过数据去决策。
2001 年我刚读大学,电脑输入法都是用智能 ABC。打字非常慢的,需要打然后去选,效率很低。后来出现了紫光拼音,相比之前就好了很多。打起字来感觉按键都没有按下去,字就已经跳出来了。但是也有问题,就是互联网新出现的词汇打不出来。这是因为它的词库更新比较慢。到了 2006 年的时候,搜狗输入法出现了。当时给我的感觉是比较震撼的。网上出现的一些新词汇,很快就能打出来,并且很流畅,就是因为它利用了数据。不论是打的字也好,还是搜索引擎里用的字也好,搜狗都会收集起来,进行统计分析。通过词频统计,把一些新出现的词抽出来,更新到用户的词库里边,这样就让输入法变得更好。对比之前的输入法产品,其中最大的区别,就是利用了大数据。
结合以上这两个例子,我想表达的就是数据的价值有两点:一是数据驱动决策。帮助你拍板,更科学的做决策。二是数据驱动产品智能。怎样让产品变得更加智能化。
下面我将主要围绕这两个视角,来讲数据驱动的价值。
二、数据驱动决策
(图 2 数据驱动决策)
在互联网公司,数据驱动决策包括三个视角:
- 运营监控。搞一些运营活动,不管是市场活动,线上线下活动,总之针对用户的运营。运营情况、转化情况,都是要通过数据进行监控的。
- 产品改进。产品的新功能使用情况如何,接下来该怎么迭代,都要基于数据。
- 商业决策。是否要在新领域开展业务,是否要收购一个公司,都是要通过数据来做决策。
2.1 数据驱动运营监控
对于运营监控,可以分成三点:
- 留存。用户有很好的黏性,不断过来用产品。
- 拉新。怎么获取新用户。
- 变现。怎么从用户身上赚到钱。
对互联网产品来说,我觉得运营的核心就是把这三件事做好。
首先,从用户留存的角度。留存在我看来,重要性比拉新还高。做一个产品,我们把产品推上线,首先要关注的是,不是拉很多用户过来,而是已有的用户,哪怕是种子用户,来了之后都不走了。黏度很高,来的用户都能留下来,那以后滚起来是很厉害的。但如果比较低,拉多少用户,就像猴子掰玉米一样,结果只剩了两个,这个就大打折扣了。
那怎么做留存分析呢?我们来看一个例子。经常看到一些餐馆会搞一些会员活动,比如每周二东坡肉半价优惠。那会员活动会带来什么后果呢,是会员进店次数增多呢,还是只有会员日过来,其他时间就不过来,只是换了个时间,占了点便宜呢?这些我们通过留存分析,就会发现到底活动是不是有效的。
(图 3 餐馆门店留存分析)
这是一家连锁店,连锁店有好几家分店。红色标注的是案例门店。这家店以及倒数第二家都搞了会员活动,我们看到它们的前三周留存率都超过了 20%。没有搞的店就没有这样好的数据。因此可以判断会员活动本身就是非常有用的。不止会员日当日会过来,在其他时间表现也是非常好的。通过留存分析,就很好地解答了会员活动是否有效这个问题。
运营的第二个事情就是拉新,我们怎么去获取新用户。
获取新用户,不能只关心怎么到你这里的。许多市场的同事容易存在这种误区。在做宣传的时候,用户注册了,就是达到目的了。其实不然,要衡量用户激活。什么意思?用户激活就是完整的体验了你产品的核心流程。如果做不到这一点,那注册的价值就没有那么大。就拿一家新闻网站来说,如果用户只停了 0.5 秒就跑了,那不叫激活用户。用户起码得看个 20 秒或者 30 秒才行。
我们来看一个例子。这是在 8 月初的时候,我发现我们从某网站来的流量忽然增加了,明显要高一些。问团队的同学是不是有什么合作。后来得知,是在合作伙伴那里把我们加上去了,从那导入了一些流量。我问效果怎么样,市场负责同学就说挺好的,访问首页每天都增加这么多流量。我听完就笑了,用户来了之后,是否变成了一个激活用户?不然来了可能都是无效流量。
(图 4 首页访问来源分析)
对于自己官网来说,只是到首页还是远远不够的。我会关心这个用户是否会注册申请使用,注册之后就会发一个账号,还关心是否会登陆,是否会进行关键的操作。这样就形成一个漏斗,这一系列的之后,我判断他是一个激活用户。做市场活动,就是要把登陆使用的用户吸引过来。中间环节虽然有用,但达不到最终目的。当你通过数据发现异常的时候,就尽快去用它。
(图 5 用户试用转化漏斗)
按照来源分组后,我发现这个来源的用户,转到到试用的比例非常低,因此判断这个合作伙伴链接,并不是一个有效的渠道。
运营的最后一步是变现。举个例子,滴滴打车。平台对司机要进行抽成,那抽成多少比较合适呢,这也要通过大量的数据来进行分析,不是随便拍脑袋做的决策。
2.2 数据驱动产品改进
讲完运营监控,接下来讲数据怎么驱动产品改进。大家可以回想一下平时是怎么做产品的。
(图 6 产品迭代的错误流程)
我把它归结为两个环:一个是拍脑袋,一个是研发功能。基本上,产品经理通过一些调研,想了一个功能,做了设计,把这个研发出来,然后看一下效果怎么样。都是凭一些感觉,然后再去做下一步。基本上就是不断的拍脑袋做功能。这样总是出现问题,很容易走一些弯路。产品经理也不知道问题出在哪,所以更好的方式还是要把数据用起来。
这就是《精益创业》里的提到的一个理念。相比前面的两个环,加入数据分析。我们是有一些点子,通过点子去研发这些功能。研发这些功能之后,重要的是要进行数据收集,然后进行数据分析。基于数据分析得到一些结论,然后基于这些结论,再去进行下一步的操作。整个过程就形成了一个循环。这样人为的因素影响越来越少,更多的时候是用一种科学的方法来进行产品的迭代。
(图 7 产品迭代的正确流程)
2008 年我在百度知道做研发。我们做了一个个性化推荐的功能。就是根据用户以往回答过的问题或浏览过的页面,推荐待解决问题。那引导语是用“等待您来解答”,还是“我来帮忙解答”。当时很难做决策。产品经理就做了一个测试,最终通过数据来判断采用哪个。我们发现“等待您来回答”,比“我来帮忙解答”点击率高了 15%,用哪个不用哪个就很显然了。如果这些事情不通过数据分析是很难知道的,也不够客观。
(图 8 百度知道问题推荐)
2.3 数据驱动商业决策
第三点就是数据驱动商业决策。比如:我们一段时间官网访问的用户分布。北京第一,上海第二,深圳第三,杭州第四。一般人觉得广州也挺多的,但是数据显示广州还没有青岛多。青岛为啥这么多,这个我也感觉挺奇怪的。后来了解到,青岛那边有很多孵化器、科技园等产生了影响。那如果我们自己要开分部,那我们就按照这个这个数据,哪里访问量多,我就到开到哪里去。这样跟我的用户分布是匹配的。
(图 9 神策官网用户分布)
三、数据驱动产品智能
讲完了数据驱动决策,那数据更大的一个价值就是产品智能。什么是产品智能呢?数据能够自动反馈到产品里边去,就像百度搜索上的点击调权。根据用户点击情况,去调整在搜索结果中的位置。我们把数据收集起来,然后在这个基础上,去设计一些算法,这样让产品变得更加智能化。产品智能覆盖的面比较广,个性化推荐、精准广告、AI 等,都属于这个范畴,我就不展开来讲了。
(图 10 数据驱动产品智能)
四、不同创业阶段的数据分析
再来看一下,在不同的创业阶段,怎么做数据分析。
我把创业公司分为三个阶段:
首先是 MVP 阶段,也是《精益创业》里边提到的一个概念,即最小可行产品。这个阶段产品没有定形,我们总是在试探产品核心功能该做成什么样子。这些时候也没什么数据,主要是做定性分析,种子用户可能都是你认识的,这时候并不需要专门的数据投入。
接下来就会进入增长阶段。你的产品出来了,相对比较成型了,这个时候你就需要关注留存、拉新。首先保证老的用户体验比较好,不断留下来。另外新的用户怎么吸引过来。这些过程需要做大量的数据分析,我们就需要专门的数据工程师、数据分析师,来去支持数据分析的工作。同时也要借助一些数据分析工具。
(图 11 理想和现实中的数据驱动)
在这个阶段经常出现的问题,是在数据分析这块效率比较低。一般市场、产品、运营都有数据需求。那工程师从杂乱的数据中满足需求,效率比较低,几天一个。因此还是要把数据源整好,数据源整全整细。让业务人员自助地去完成数据分析的需求,这样就从串行的事情变成并行的事情,从几天满足的需求,变成几分钟几秒钟满足的需求。效率就得到提升了。
到了增长阶段后期,也就是变现阶段。用户到了一定规模,那一定要考虑变现方面的事情。这时候可能营收相关的数据分析比例就会非常大。那你会关注渠道、成本这些东西。对于大体量公司来说,一般就会有专门的数据团队,适当借助第三方工具。
对一家公司来说,所有数据分析的工具、平台都自己开发,这也不现实。这就像在电气时代,每家都建个电厂,也不现实。有一些公司专门做工具,其他公司用这个工具去提升效率,那就可以了。
五、常用数据分析工具
那在数据分析这块,我把常见的工具分成 6 类:
第一类:流量分析类(Google Analytics、百度统计、CNZZ 等)
这类产品都是流量时代的产物。三大门户、新闻网站,包括个人网站等,那个时候谁的流量大谁就牛。所以关注点主要是访问量统计。
第二类:App 分析类(友盟、TalkingData、百度移动统计等)
2009 年智能手机慢慢起来了。起来之后,出现了专门针对 App 做分析的。这些统计工具关注的点,就关注 App 装机量、激活量,统计一下活跃用户数。这些是可以,做一些深度的分析还是不太行的。
第三类:用户行为分析类(Mixpanel、Heap Analytics、神策分析等)
相比于 App 分析类,这类公司偏向于用户行为分析的深度分析。比如我们神策分析可以自定义事件、维度、指标体系,数据源采集上也会支持的更全更细。
第四类:数据可视化类(Tableau、Qlik、BDP、永洪 BI 等)
这类产品主要解决数据可视化的问题,特别是老板看报表的需求。
第五类:应用市场监控类(App Annie、ASO100、ASO114 等)
偏向于监控在应用市场中下载和评论这些数据。
第六类:广告效果检测类(AppsFlyer、Adjust、秒针、AdMaster 等)
AppsFlyer、Adjust,这些都属于这一类,一些出海的应用在用,监控 Facebook 之类的广告效果投放。
六、数据分析的流程
接下来看一下数据分析金字塔:
(图 12 数据分析金字塔)
第一层:要做数据采集,把数据采集源头整好。
第二层:对数据进行建模。
第三层:真正去做数据分析的事情。
那我们要避免的误区就是:我们只关注第三层的数据分析,只关心要取数,把数拿到,但是不关注把底层数据采集跟建模这些事情做好。那就会发现这个数据本身也很容易出错,另外去获取数据的时候效率非常低。
七、互联网公司的数据分析痛点
再来看互联网企业在数据驱动这点上,常见的问题:
1、创始人/管理者本身缺乏数据意识
平常都是拍脑袋做决策,凭感觉行事,下面的人就没有动力去关注数据了。所以想成为数据驱动企业,创始人本身要对数据要有敬畏之心。要知道不管什么时候,看数据是第一位的。
2、工程团队和数据团队的配合问题
数据本身是牵扯到整个业务的方方面面,扎根到一个产品里边的各个环节里面去。但是工程团队一般都是在忙着开发功能,在做这个产品迭代。数据相关的需求都是比较低优先级的,都是顺便搞一搞。这样就导致第三个问题,那就是数据采集缺失或埋点混乱,数据根本就没有采。数据根基不行,想要的数据都拿不到。
3、数据采集缺失或埋点混乱
4、缺乏数据工程师/分析师人才
数据工程师还好,数据分析师没有系统的培养方案,大学没有相关的专业,也没有很好的培训课程。这是一个比较大的问题。
八、传统企业的数据分析痛点
传统企业,问题更大。前面说的互联网企业的问题,它一个不会少,另外一点它还有它更大的问题,最突出的两点:
1、数据采集条件不具备
2、数据分析的能力欠缺
最后做一个总结。对于一家企业,想要成为数据驱动型公司,要做到以下三点:
1、培养数据驱动的意识。
2、重视数据采集。
3、借助合适的数据分析工具。
如果你想成为数据分析师
不管是在知乎上,还是在一些线下沙龙,许多数据分析爱好者都想能够系统的学习数据分析知识,而不是琐碎的学习。遗憾的是现在没这样的专业,系统性的培训也是少之又少。我是在想有没有可能通过几轮迭代,创造出一个适合数据分析人员学习的培训课程。
作者:桑文锋,神策数据创始人兼 CEO,前百度大数据部技术经理
本文为专栏文章,来自:桑文锋,内容观点不代表本站立场,如若转载请联系专栏作者,本文链接:https://www.afenxi.com/35852.html 。