车品觉分享:那些年,我在阿里决战大数据

回顾我在阿里的6年,从经历来说,是先负责支付宝,继而负责淘宝,最终负责整个阿里集团的数据工作。实际上,这个过程同样也是我对数据应用的一个历程:第一阶段用数据,第二阶段养数据,第三阶段从看数据到用数据。

摘要:今年4月,阿里巴巴集团副总裁车品觉从阿里巴巴离职,加入红杉资本中国基金成为专家合伙人。首任阿里数据委员会会长的他曾花2年时间打造了支付宝的王牌团队——数据分析团队,之后4年又几乎从无到有创立了淘宝的数据分析团队。今天,就让那个我们听听车品觉独家分享,他在阿里6年的故事。

回顾我在阿里的6年,从经历来说,是先负责支付宝,继而负责淘宝,最终负责整个阿里集团的数据工作。实际上,这个过程同样也是我对数据应用的一个历程:第一阶段用数据,第二阶段养数据,第三阶段从看数据到用数据。

我在支付宝

加入支付宝之前,业内都认可我是一名比较懂得用数据去设计、优化、迭代产品的首席产品官。彼时我在支付宝,大胆地把产品与数据分析部门结合,累积了不少经验。

车品觉分享:那些年,我在阿里决战大数据

数据产品化,这个理念随我加入支付宝

说起加入支付宝,其实有些偶然。当时,支付宝邀请我去分享如何用数据做产品。分享会之后,我去了华星大厦的一个会议室,里面坐着Lucy(彭蕾,时任支付宝CEO)、Eric(井贤栋,时任蚂蚁金融COO)。在那个会议室里,他们问了我几个如何能用好数据的问题。当时,我反问了Lucy一个问题:“你每天大概会看多少数据?”

“大概几十个吧。”

“不对,你不应该一天看几十个数据那么多,我觉得你应该只看几个数据就够了。”

或许,他们已经不记得我提出的这个问题了,但是我却记得非常清楚。因为在支付宝的两年里,这是我做数据产品时一直遵循的原则。正式加入支付宝后,我面对的第一件事情就是着手组建分析师团队。2010年的支付宝,公司里大部分的业务团队对数据团队都不太满意,而且高层对数据能产生的价值也没有太多认识。而数据负责人的调职,也导致了支付宝的数据分析和数据技术部门被分开管理。

面对分析和技术团队的目标不一致,加上业务部门对为什么要使用数据及如何用好数据充满疑问,甚至有人认为数据分析仅是门面功夫,所以技术团队有时候会跟我的团队“对着干”,因为两个团队的老板不是同一个人,他们也没有义务一定要支持我,所以甚至有时候会撇开我们直接跟业务部门对接。

但是最后,我坚持的数据分析产品化路线,最终得到了双方的认同,甚至技术团队还主动过来问我:“我们怎么合作比较好?”所以那时,双方的关系从“对着干”变成了“我们会全力支持你”。终于有一天,Lucy走到我办公室跟我说:“你知道吗?你们做的产品让我觉得很爽,我很喜欢这个产品。”而当我在支付宝的第二个产品“地动仪”出来时,她跟我说:“这就是我梦寐以求的数据产品。”

同事们和老板对结果的支持,让我肯定自己在支付宝走的这条路是对的。如果让我总结这其中的精髓,我的秘诀就是:数据分析也要讲求用户体验。

记得后来我晋升到副总裁,成了当时阿里巴巴数据领域职位最高的人的时候,Lucy曾经说:“在中国,品觉是数一数二的分析师。”这句话当然是对我个人的偏爱,但如果她指的是数一数二的最好的分析师(电商平台),我觉得能勉强接受。

用产品化理念管理数据团队,从“地动仪”到“黄金策”

总的来说,数据产品化的理念最终得到了Lucy、高层管理者,以及团队和同事们的认可,那么针对这个理念,我是如何在团队内一步步推动的呢?

首先,我让团队做好基础服务——“白米饭”。为什么叫白米饭?因为对人来说,如果饭不够就会出大问题。对于公司来说,如果数据基础服务满足不了我们的用户,那么他们就会跳起来,那时候再高大上的报告也没用。所以,我要求分析团队一定要跟业务部门达成一致,知道什么东西如果我们不提供给他们,结果会很严重。

另外,我抽出团队一部分人成立了“突击队”。每当我听到管理层对数据的需求时,就会把信息带到团队,让团队成立2~3支“突击队”,让管理层用到有用的、合时和带探索性内容。把自己最精锐的部队放在突击队里,这个决定非常重要。

基于“白米饭”和“突击队”,最后一步,我们开始沉淀数据分析的框架。

在支付宝时,基于Lucy和Eric给我的支持,数据产品都是自上而下推行。我先做了“观星台”,这是一个高管的数据仪表盘工具;然后做了“地动仪”,一个给中层管理看的数据产品,接着还有客服360等。

所有这些数据产品,都是从数据分析框中提炼出来的。把分析的理念和框架变成数据产品,本质上是一个数据泛化的过程。这个过程非常重要,因为数据报告的需求会越来越多,如果没有泛化数据给使用数据的人,分析团队将永远被冗杂和重复的工作所困。

我们还创造了一个产品叫“黄金策”。“黄金策”可以让用户很轻松地在3秒钟之内就看到不同标签下用户购物行为的异同。比如,看30-35岁的上海女性,有一张信用卡和多张信用卡的两个不同群体,她们的购买行为有什么不一样。或者,看广东和上海的女性在购物表现上有什么不一样。用户可以非常轻松地比较不同用户群的购物表现。所以,我认为好的数据产品应该是可以激发用户灵感的。

让用户喜欢数据,就会让团队喜欢自己

除去以上这些有关数据的东西外,那时我还做了另一件事。我启动了一个项目叫“西湖品学”,每年请公司外的数据牛人来分享经验,这是数据人的一场盛会,当时很受欢迎。我做“西湖品学”有两个原因:首先,我认为人们不使用数据不是他真的不想使用;其次,没有人推广使用数据的好处。

那时,我常在支付宝说一个比喻:“我右手用得好好的,你突然让我用左手,那你就要告诉我用左手的好处,不然我无法改变习惯。”

用数据的习惯也是一样,当他知道数据好用的时候,就肯定会用。所以,每一年的“西湖品学”,我都请外面很多人来讲数据到底有什么好处,让公司内部的数据人知道数据应用的商业场景是怎样的,从而激起更多人对数据的渴望和期待。“西湖品学”就是这样一个全新的尝试。

当我的分析师看到管理层很激烈地讨论他们做出的报告时,我能看见他们脸上的笑容:“不枉我们两个星期不眠不休地把这个报告做出来。”其实,我们大多数据人都不怕辛苦,怕的就是作出来的东西没人看。

每每回想起我在支付宝的两年,甚至离开支付宝到了淘宝之后很久,公司内外依然有很多人对我说支付宝的数据分析团队是最棒的。每当遇到这样的赞美,我都觉得非常欣慰。所以,那段经历让我感觉非常幸福。

我在阿里集团

车品觉分享:那些年,我在阿里决战大数据

有一天,Lucy把我叫过去说:“现在淘宝很需要你,淘宝的数据体系需要你去整理。”

那是2012年年底,也是我在支付宝的黄金时代,就这样我来到了淘宝,开始了我在阿里后四年的时期。淘宝前两年的经历非常丰富,每每想起来都像过去了10年,我的白发基本上也都是在这段时间长出来的。

一样的开始,不一样的数据分析框架从支付宝来到淘宝,意味着我要重新开始打一仗。由于我已经在支付宝打了一场胜仗,所以可以照搬很多顶层设计到淘宝使用。但我也不能完全照搬,因为淘宝使用顶层设计有些跟支付宝一样,有些却完全不一样。

淘宝跟支付宝其相比其实要复杂很多,淘宝本身是个自下而上的组织,是个极其复杂的生态圈。“有趣”的是,当我来到淘宝时,居然面对的情况恍如回到了入职支付宝时的情形:团队的人都差不多走光了,我感觉就像进入了一块杳无人烟的新大陆——分析师只剩下几个人,而且我被告知这几个人还会陆续离开。

面对这一切,我做了一个今天想起来仍然感觉很勇敢的决定:我说我不会带支付宝的一兵一卒过来。所以说,我是在支付宝建了一个完整的团队,然后在淘宝又重新组建了一支全新的团队。这段经历其实让我很痛苦,但也是极为珍贵的人生经历。当时,淘宝的数据技术团队很乱,而且是累积多年的乱,所以要整理淘宝的数据体系,只用顶层设计和数据产品的方法来做,肯定是行不通的。

但还好此时我已经有很多经验,加上当时的总裁三丰跟我的感情非常好,比起我在支付宝时,其实办事更容易。比如在支付宝我还不能直接问Lucy到底你要什么,但在淘宝我可以随时到三丰办公室问他要什么,所以在支付宝我只是一步步尝试满足Lucy的需求,而在淘宝我有管理层的绝对支持。所以,我遇到的问题都是来自内部,没有外在问题。

“混通晒”和“存管用”,帮我打通数据闭环

在我淘宝的几年生涯里,一个非常重要的项目让我永远难忘。有一年,马总让我们把聚划算自动化,在我眼里其实这就等同于商业版的无人驾驶技术——因为,要把聚划算这个部门的品类规划、选品、定价等流程自动化,让机器决定什么产品哪天上聚划算。要求整个链条中的决策都要自动化,而没有人参与其中,这对我们数据的收集、加工、提炼等整个链条的能力都提出了非常大的考验。

而且,这个项目也是真正实验如何在业务运营中使用数据技术成为主干,数据能力、算法要完全溶入到业务流程当中,每个环节中的数据回流等成为闭环的一部分。

好在这时我们的部门已经是一个具备全方位支持能力的,能够覆盖数据的准备、加工、收集、分析、整合到使用整个链条的部门了,而且我的数据科学团队也已经开始涵盖集团中很多不同业务的项目,甚至连交通这样的政府项目都有涵盖。

我这段时间的经历,我想说我很荣幸,能够用我的白头发换来亲自经历了一场人机大战的故事,让我可以在过去三年中,接触到了这么多数据甚至整个数据链路,最终我实现了数据应用的闭环。要做好数据,我们首先要在数据使用的闭环中让数据越来越容易使用,同时在数据准备的闭环中,让制作数据的成本越来越低。

整合和配合,数据团队要学会取舍

淘宝的年代,可以说是我在支付宝成功之后的收成期。得到领导的信任,拿到很多重要的项目,很多人都想加入我的团队,人才也不再是一个问题。

从我进来淘宝到现在,数据团队一直是急速奔跑的团队。我进淘宝时,团队仅仅7个人,如今已经发展到700多人,规模扩大了100多倍。与此同时,数据部门承载的管理层的期望也越来越大,也越来越在聚光灯下。

中央部门很难做好应用,分析师也一样。应用和分析师都需要对业务场景非常理解才能做好。而底层的数据怎样更灵活、更快、更容易给用户使用,这肯定是中央部门需要做的。

但划分不是完全绝对的,而是你中有我,我中有你。决策分析肯定最好放在中央,因为决策分析是服务整个公司的,帮助CEO来看大盘,肯定不能用业务部门的视角。

数据则分公有数据和专有数据,专有数据要回到离应用比较近的地方。公有数据是公司最有用的资产,在中央部门集中管理,让它成为很重要的材料以供别人使用。

这些年来,我觉得现在阿里的数据依然没达到我理想中的蓝图,主要有两个原因,一是整个大环境还未形成,二是阿里的数据环境才刚开始,演变是循序渐进的过程。

我看数据科学

车品觉分享:那些年,我在阿里决战大数据

在2010年年底,我就意识到有大数据的出现,所以当时就跟Lucy提出,支付宝要有一些数据科学的人才储备,但可惜的是,我虽感觉到了新时代即将来临,却未能正确地指出机器学习的趋势,所以未有大力引进。

而到了淘宝后,我是第一个在管理层力推大量招聘数据科学家的,当时还有其他高管质疑我的做法。但在当时淘宝总裁的大力支持下我终于如愿。

传统的数据科学家常常是博士或博士后,研究的方向是机器学习。数据科学家的出现其实是个演变的过程,几年前企业的数据应用都是看多用少,不够直接,也很少涉及机器学习、算法等领域。

从数据科学家进来的那天开始,我就认为他们是不可缺少的,他们的工作不是今天的数据分析师和数据挖掘工程师能做得了的,虽然数据分析团队中也有数据挖掘的人,但数据科学和数据挖掘是有所分别的。

我认为合格的数据科学家应该是有产品意识的,为了解决问题会更偏重于找到问题的原因,然后寻找最好的方法来解决它。所以可以说,区别就在“科学”这两个字。

数据科学是科学不是工程,工程追求效率,科学追求真理。如果数据科学家做得太实操,就会变成一个数据挖掘工程师。企业想要找到既能上天也能落地的数据科学家很难。在我眼里,一个企业如果有这样的人,就像三国时期刘备拥有了关羽。但可惜的是,这世上的关羽少之又少。

经历过对数据科学的理解后,回想我在支付宝做的最后一个“黄金策”,如果今天让我重新做这个产品,我不会用以前的方法,因为今天的技术和曾经已经不一样。

“黄金策”给人的感觉是可以发现很多东西,但同时能发现的东西也是有局限的。虽然有600或800个用户变量给你自己组合,但数量还是只有600个或800个,能不能有6000个8000个呢?从今天的技术来讲,用深度学习的方法。有些环节机器会比人做得更好。

到今天为止,让数据告诉我们新的发现,而不是人的经验,还是少数情况。但数据带来的这些新发现,是人类以前的逻辑中所没有的。换句话说,数据重组了这个世界的“可能”。因为人类的思考本身就是有局限性的,如果使用集体智能,用深度学习的方法来找出人都提不出来的假定,然后通过人机协作让我们找出未来的新世界、新智慧,而这就是数据科学要走的路。

数据科学如果不是每天都在进步,每天不满于今天的状态去PK以前的理论,就不是数据科学,而是死工程。数据科学每天都在突破以前的理论,因为以前的理论只能解决某个点,以前的顶层设计只能适合以前的情况,未来的顶层设计怎么样,需要我们不断去探索,而科学就是探索。

车品觉分享:那些年,我在阿里决战大数据

本文摘编自车品觉著作《决战大数据(升级版)》

来源:湛庐文化

本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。

(0)
车品觉的头像车品觉专栏
上一篇 2016-06-03
下一篇 2016-06-06

相关文章

关注我们
关注我们
分享本页
返回顶部