摘要:在大数据时代,如何挖掘数据的价值?互联网人又应该具有什么思维?在黑马连营 的课堂上,曾在阿里巴巴领导大数据分析等工作,时任1号店副总裁的张高峰做了主题为“大数据在电商的应用与趋势”的分享。
以下为张高峰的分享(有删减):
今天,我分享的主题是“大数据在电商的应用与趋势”。
首先分享一下,在我眼中,大数据是如何炼成的?我认为人类社会和数据有关的历史可分为三个阶段:无数时期、初数时期以及大数据时期。
上古时期人类处于无数时期,彼时数据没有记录。仓颉造字以后人类社会进入到初数时期,后面有两个因素促成了这一时期数据的大发展。第一个是数据的存储介质经由甲骨变成竹片,最后变成纸;第二个是人们后来发明了活字印刷,使得数据的生成成本变得非常低。
再后来科技革命之后,人类社会逐步进入了大数据时期。大数据时期有两个基础:第一个基础是计算机高度普及,而且计算机的计算和数据存储能力遵循摩尔定律的速度在发展;第二个基础是各处数据能够在互联网上以光的速度进行传输。以数据传输速度来比对,在初数时期,《圣经》要花两百年才能传遍世界的每一个角落,唐僧西天取经历时17年行程5万公里才从印度运回大量经书,而现在在互联网上,任何人发送一个消息,1秒钟就可以绕地球转7次半。
大数据时期的数据是记在硬盘上或者是云上的,是以光的速度在互联网上传播的,甚至是自动生成的。举个最简单的例子,苹果手机有一个健康的应用,关不掉,也删除不了。它每天都在记录你走了多少步路,爬了多少层楼梯,这里的数据是由传感器生产的。所以我们要清楚,所谓的大数据时期,一方面计算机的数据存储成本变成零,另外一方面是数据以光的速度传播,还有一个很重要的概念是数据的生成不以人的意愿为转移。所以大数据时代的基本特征是一切皆可记,因而一切皆可测。
如何挖掘数据的价值?
所有的东西要发挥价值都是以问题为出发点。
我想先讲一个华盛顿大学人工项目负责人奥伦-埃兹奥尼教授的例子。在2003年的时候他表弟要结婚,于是教授就提前订了机票。上飞机之后教授开始搭讪一个美女,问美女买的机票多少钱。教授本意是想自己提前了很长时间订的票,一定比美女订的要便宜。美女的答案却告诉教授,对方买票比自己的便宜,而且订票时间还比自己晚。然后教授问了更多的人,这些人和美女的情况都差不多。
愤怒的教授没有痛斥航空公司如何骗取自己的血汗钱,而是在互联网上获取了12000条机票的价格售卖信息,分析机票的走势,然后写了一篇文章。论文中,他模拟了607个顾客。研究的结果是,如果这607个顾客,按照他所发现的机票的价格波动规律和趋势去买票,平均能够节省27.1%的费用。
论文发表后,他还给自己的机票价格预算方法申请了一个名叫Hamlet的专利。然后又做了一个叫Farecast的机票价格预测网站,在网站上他将机票售价以最简单的趋势图标识出来,并进一步标注了预测的可信度。据说这个网站每年给美国航空公司带来数百亿的收入损失。后来微软找到教授,花了1.15亿美金把Farecast网站买了下来。
做完这件事情以后,教授又转身做了一个让美国民众买大件商品(如电子产品)的时候可以省钱的网站。首先他凭这个想法在2008年就融到850万美金。2011年6月比价预测网站Decide上线,告诉你买什么和什么时候买。他依然是通过网络去爬取每一个商品的信息,然后通过数据模型预测产品未来的售价是涨还是跌。教授做的这件事情又被Ebay注意到了,Ebay后来开始给网上的卖家推销教授的服务。最后在2013年9月,他又把这个网站卖给了Ebay。
我想用这个故事讲的是,大数据时代,我们要有大数据的基本思维。我们要记住在大数据时代,所有的数据其实都是可以获取的,所有的东西都是可以基于大数据进行预测的。
大数据应用之一:精准营销
互联网上无论有多少数据,都是由坐在电脑前面或者是拿着手机的人产生的。如果能够把互联网当中所有数据以人的维度去组合和分析,就可以预测每一个网民的未来行为。
其实,人们很早就已经开始对数据库的数据做分析和应用,最后获得了很好的营销效果。啤酒和尿布的故事大家都知道吧,沃尔玛通过数据挖掘发现很多会员在周五买婴儿尿布的时候也会买啤酒,或者是买啤酒的时候同时买婴儿尿布。根据这点发现,不同的超市做了不同的促销方案和购物路径设置,获得了其预期的效果。
这个案例被到处宣扬时,还没有互联网什么事,当时的数据只是存在数据库当中。因为你在超市当中买东西,超市没办法跟踪你的行为,只有在结帐的时候才知道你最终买了什么。而互联网的进步是什么?互联网所催生的电商的数据库里,不但知道你走的时候买了什么,在你买某个商品之前,你看过什么、搜过什么,电商都知道。
电商所拥有的丰富数据,为什么能够预测你未来的行为?是因为每一组数据和一个社会现象之间,都存在千线万缕的联系。常规来讲,数据和现象之间的相关,一种是正相关,一个是负相关。比如,如果你生活不规律,天天加班,加班后吃方便面充饥,这种生活状态肯定是刚毕业的小年轻比较多。而当你进入到婚姻当中,生活规律性会上一个台阶,你如果有计划去要小孩,可能就会戒掉以前不健康的生活习惯。而这两种状态下,你经常购买的东西是不一样的。正相关因素的东西买的越来越多,负相关的不买了,此消彼长的大数据就会透露一些蛛丝马迹。推广开来看,所有拥有大数据的公司,都是可以通过各种数据模型的设计,去分析顾客在各个维度的消费习惯和特征。
当我们有了你的基本特征、身份特征、连续很多年的购买记录,可以想像我们会知道你很多的消费行为模式。以酒水为例,如果我知道你怎么喝酒,我就知道怎么去服务你。喝酒有很多种模式,有的人只在聚会场合喝;有的人自己不太喝,买酒主要是为了送亲友;有的人则天天都要喝。对这几种人做酒类营销的方式,肯定是需要不一样的。
说了这么多案例,我只是想告诉大家,大数据时代让我们更容易获取对用户的洞察,了解用户过去是怎么买的,甚至预测其未来会怎么买。我们的营销可以达到这种效果,哪怕是一个完全相同的活动,但是对不同的人的营销话术可能是不一样的。
当所有的行为和信息都被记下来以后,你未来买的东西可以被分析和推荐,在这个基础上就可以让你花更少的时间去购物,花更多的时间来享受生活,所以说大数据应用在个性化营销方面可以让我们生活得更轻松。
在精准营销方面亚马逊做的很好,是个性化推荐的鼻祖。有数据称亚马逊有超过40%的订单来自个性化推荐,推荐的东西被用户采纳的概率高达70%。亚马逊的后台全是数据,所以说你不能把亚马逊简单的理解成一家电子商务公司,其实它是靠数据来驱动运营的。
在亚马逊的用户档案当中,有你的购买历史,有你对每一个商品的评价,有你把什么东西放在购物车等所有数据,亚马逊基于这个数据,使你在亚马逊上看到的东西都跟这些东西相关,你看到的是数据组成的一个个性化的页面。
在中国,用户收到快递的速度很快。美国跟中国不一样,美国地大物博,人住的分散导致收到快递要用5-7天。亚马逊为了提升美国人的购物体验,在2012年年底申请了一个叫“预期递送”的专利。前几天我就知道你今天会下单买某个商品,然后亚马逊提前就把你要买的商品 送到离你家最近的配送站里了,你今天一下单就能立即送到你家,提升收货的时效性。这是怎么做到的?我跟大家说几种可能性。第一,很多东西是周期性购买的,比如说柴米油盐、麦片、面包等;第二,可能很多人会对促销非常敏感;第三,基于片区人口特征的购概率测算。
大数据应用之二:供应链
用户在网站上下了单,对电商来说其实忙碌的时间才刚刚开始。电商的工作人员需要把你买的东西从货架上拿下来,放在购物车里,再将购物车推向包装台,由包装人员包装,包装完之后需要有物流送到离你家最近配送站,然后再由最后一公里的配送员给你搬到楼上。
我简单说一组最基本的数据,超市零售行业的毛利在沃尔玛成立的时候定了一个标准,不要超过23%。目前为止中国所有超市的毛利基本都不超过这个水平,因为要跟沃尔玛竞争,而电商为了从线下抢客流,其毛利更低。这样的话,用户在某个电商平台上买了200多块钱的东西,电商平台平均只能赚20-30来块钱。如果电商平台想要赚钱,就必须要把从拣货环节到最后一公里配送的所有中间环节做到最优,节省人力成本。
那么,如何把拣货环节做到最优呢?
第一,库位优化。要把最畅销的东西放在最容易拣的地方,但是数据是随时变化的,所以要分析一年的销售规律趋势。
第二,订单池、订单聚类与分波次。要把相似的订单聚在一起。比如20个人都买了云南白药的牙膏,如果每单都分开拣,那么就得拣二十次。如果一次要帮20个人同时拣货,这20个人每2个人当中都有1个商品买的是一样的。这样就能够减少拣货次数,平均每个订单只需耗时70秒。
第三,TSP路径优化。1个员工每分钟的拣货成本至少是5毛钱,负责拣货的员工要很清楚下一个拣货位置在哪里,知道商品是在哪个区域第几排货架等等。大数据可以使拣货路径得到优化,每个点走的路径最短,这就是大数据在拣货环节的应用。
到了大数据的高级阶段,数据当中的规律和模式被人提炼出来,计算机和机器人在未来会用数据运行的方式代替人的工作。
刚才讲的两个方面,一是大数据为顾客的购买体验提升服务(精准营销),二是大数据为顾客的购后体验提升服务(供应链环节的效率提升)。这都属于为数据的所有都提供运营优化的服务。此外,所有的数据,也可以为数据所有者的上下游供应商或合作伙伴服务,还可以对全社会创造价值。
除了刚才讲的电商,大数据在生物制药和医疗领域也有着广泛的应用。比如,以色列有一家初创公司叫CliniWorks,可以从大数据中寻找到疾病的最佳治疗方案。
曾经有人说过,数据是新时代的黄金,是一种新的经济资产类别……最后我想用一句话结束今天的分享,大数据会让我们未来的生活更美好。
Q&A
营员:中国的消费者在电商平台上有消费粘性吗?
张高峰:中国的消费者最没粘性,哪里有促销消费者就在哪里。中国的电商到目前为止很惨烈,很多企业亏钱。
营员:现在只有互联网才有大数据,非互联网公司如何获得大数据?
张高峰:刚才我讲的例子里面,教授做机票预测的时候,没有数据怎么获取数据?第一,可以做网络爬虫,因为网络的数据是公开免费的。第二个获取数据的方法是花钱买数据,但买也是要有技巧的,比如航空公司推出的登记飞行航班就给你积分奖励,其实质就是在花钱买你的飞行记录数据,为向你销售更多的机票提供数据或政策设置支持。
口述丨1号店副总裁张高峰
来自丨黑马连营课堂
本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。