过去三四年中,大数据以极快的速度从概念走入现实,深度嵌入到了经济社会中的方方面面。回望来路,大数据究竟给发展带来了哪些切实的机遇面向未来,政府治理究竟该如何适应这一新的科技革命?看看大数据专家车品觉是如何回答的
就上述问题,近日,笔者专访了大数据领域的知名专家车品觉先生。希望本次专访的内容,能够对大数据的继续发展提供讨论的火花。
车品觉先生现任中国计算机学会大数据专家委员会副主任、浙江大学管理学院客席教授等职。车品觉先生于2010年加入阿里巴巴集团,担任阿里巴巴集团副总裁、阿里巴巴集团数据委员会会长,负责阿里大数据体系的整体规划。2016年4月,车品觉先生由阿里巴巴集团去职,加入某知名投资机构,其视野也从一个大公司的内部运作转向全社会的创新创业生态体系。
大数据是一种全新的材料,不是另外一种高科技
问:“大数据在三四年前爆发,成为经济社会各领域广泛接受的新概念。您在大数据领域有着丰富的实战经验,但是以您观察,社会层面对大数据是不是已经广泛接受?”
车品觉:
今天你跟我聊,我特别想强调的一个观点,就是大数据是一种全新的材料,它不是另外一种高科技,只要你找到了合适的方式用它,它在哪里都可以使用。这个观点看似被人重复过很多了,但是其实很多还根本不理解。我跟很多企业领导或者政府部门谈大数据的时候,发现他们很多都是停留在“解决问题”的层面,就是说,当大数据引发一件事情后,他们总是在想该怎么解决,但是很少认真探讨这个出来的事情,本质上跟以往的东西有什么不一样。因为你真的把大数据当成是一种材料的话,你就会明白,大数据带来的问题是全方位的。它不是哪一种具体的技术,让你能看到它的功能,让你有办法针对性地管理。大数据带来的影响是全方位的,很多创新出来的时候,你根本意识不到,同样很多问题出来的时候,你也完全理解不了。所以我说,一定要把它当做一种新材料,从本质上,从体系上来思考大数据。
大数据时代,最重要的是关联
问:“大数据对经济社会的方方面面都有渗透,刚才您谈到了大数据本质上是一种材料,那么,从您这些年的体会来看,对这种材料的应用,相较于以前的数据应用,究竟有什么样的新特征?”
车品觉:
如何应用大数据?首先要了解数据的生命周期。“布点”、“收集”、“存储”,这些是前端,之后需要对数据做“识别”、“关联”、“分析”。还有一个能把整个过程包起来的,就是“实时刷新”。这就是数据的生命周期,它是一个闭环。不管你怎么使用大数据,你首先要了解这个周期。大数据跟以前的数据不一样。首先,“布点”就往往不是你自己布的,有些“布点”是别人布的,所以你需要有一个对外部数据的认知。尽管你自己的数据有时候已经足够大了,但还是要关注别人的布点,要把别人的数据“关联”在你自己的数据当中。这是跟以前最不一样的。以前的数据是封闭的,大数据时代不一样了,一定需要跟外部的数据关联。
譬如反恐,一个人从新加坡来北京,他从新加坡上飞机开始,就已经跟各种数据关联了。事实上,关联的速度越快,用于计算的时间就越多。我听说美国在“911”后,用了三年的时间拿到了一种非常重要的技术,一种快速计算的技术。这种技术能从你站在海关那个地方拍照开始的五分钟内,计算出你是一个恐怖分子的概率有多大。为什么?因为它用五分钟时间把你的数据和恐怖分子的数据进行了关联和计算。这只是据说,并没有人详细知道。为什么我知道,因为它用到的这个技术,刚好是我朋友那个公司开发的,这个技术本来在华尔街的交易中心用来实现一百毫秒的运算能力,有人买了这个技术给了美国政府。
就像我刚才讲的,从人脸识别到匹配全世界十几亿人数据,如果你需要三个小时来计算,那肯定就完蛋了。正确的做法是:从你进入海关的那一刻就开始计算,之后不管你是在空中还是在陆地上,计算机都在不断关联和计算你。所以说大数据时代,最重要的就是关联。
问:“如此说来,数据关联是大数据时代的新特征,那么数据关联一定能够创造之前不可能创造的新价值,是这样吗?”
车品觉:
过去我们用数据去解决“发生了什么”这样的问题,但是从我们知道“发生了什么”到最终“如何解决”,中间是有很多的环节。随着数据技术的发展,中间环节需要人工判断的地方在逐渐减少。譬如打车软件告诉你,从现在这个地方打车到你家需要45分钟,但是你因为急事必须30分钟之内回到家,怎么办?其实后来你发现,你可以先打车到某一个地铁站,在那个地铁站乘地铁,总共半个小时就到能到家了。这个问题就解决了。但此时你发现你已经必须关联第三方数据——不单单是出租车的,还要地铁的。
过去数据很集中,就是我知道我有多少数据,问题很清楚,我能解决问题。但是我告诉你,过去的解决只是一种假设的解决,因为没有第三方数据,只是基于假定的第三方数据做决策。所以大数据的起点就是关联第三方数据。当第一方数据和第三方数据能够非常有机结合的时候,我们对数据的分析就会有一种全新的理解。
大数据应用涉及“快”、“准确”和“过去的经验”
问:“所以要做出正确的决策,关联第三方数据非常重要。那从机器的角度来看,代替人决策的内容越来越多,是否意味着对技术的需求也越来越高?”
车品觉:
事实上,人工智能、深度学习,这些都是二十年前就有的技术,但是二十年前没有大数据,没有可以关联的数据。所以大数据的故事从有了关联才真正开始。 正像我前面讲的,这个过程中,人类在中间环节需要做判断的地方越来越少了,这不是减少人手这么简单,其实它是“两秒钟”的科技,就是说,让很多事情的决策提高了两秒钟。不要以为两秒钟很简单,你要知道一百毫秒跟两百毫秒的差异,在股票市场中就是会死人的,人家拼就拼这一百毫秒。
问:“大数据的应用,代替了很多人的思考,加速了决策过程,“快”是大数据应用创造价值的主要判断标准吗?”
车品觉:
在我看来,大数据的应用一般涉及三个问题:在解决一个问题上,“快”是不是一个非常关键的点?“准确”是不是一个非常关键的点?“过去的经验”是不是一个很关键的点?“快”,我刚才说了,很多事情,胜负就是两秒钟甚至一百毫秒的事。 “准确”,自动驾驶对路上的人脸识别,过去的准确率是90%,如果你能提高到95%,很多功能就可以实现了,那就是一场革命。还有就是 “过去的经验”,也就是可重复性,我从这里跳下去死不死?这是一个低概率事件,根本没有重复性,因为我只有一条命。所以我们喜欢看的是天天都有的数据,就是发生率非常高、重复率非常高的数据,这样的话,数据分析才有大用途。
越来越多小公司入场,大数据生态进入临界点
问:“谈到大数据带来的新价值,您之前在阿里工作,现在成为一名投资人,所以无论是自己的实践,还是您看到的其他人的实践,相信都是非常多的。我想首先了解您为什么会从一个大公司的大数据负责人转战做一名投资人。”
车品觉:
对我来说现在是扩大眼光的很好的时机,可以看到更多的东西。以后有机会可以再把目光收回来聚焦。就个人来讲,我没有兴趣帮企业赚钱。为什么我要参与国家大数据工作组和网信办的一些工作,就是因为我想处理一些政府层面的问题。但是我愿意和政府官员交流,并不是说我喜欢政府的权力,权力对我来讲绝对没有什么吸引力。如果我需要权力,就在阿里继续管多一点人就行了。我真正喜欢的,是大数据带来的新生态。我跟一些政府朋友说,其实我最近挺开心的,因为我做投资之后出去见了很多小公司——这是生态的标志。
一个生态的形成意味着,你会看到非常多的、能生存下来的小公司。中国(互联网领域)只有三大巨头肯定不叫生态。能叫生态,必然是这个地方有很多的种类,很多你想都没想过的东西在出现,蚂蚁、蜘蛛……这些都是正常的生态。如果一个生态很干净,只有一座大山,那不叫生态。对于大公司来讲,比如对于阿里来讲,新生态并不是什么好事儿,因为有很多阿里的人出去创业,十几、二十几个人就组建成一家小公司。这对于阿里来讲是一件挺头疼的事情。但是对于生态来讲,这是一件好事。
我跟一个朋友开玩笑说,以前在阿里,有人、有钱、有数据,我出去见到很多小公司,没数据、没钱、没人。但我还是看到非常多的年轻人在创业,包括很多海归。我开始对这个生态产生信心。我们现在已经站在大数据带来的整个生态创新的临界点,这是大数据真正的意义所在。
有些政府部门没有想清楚,自己为什么要收集数据
问:“数据关联越来越多,人工智能越来越发展,势必会激发出大量创业公司的出现,大企业当然也会受益,也就是您所说的一个生态系统的形成。这显然也给政府带来了挑战,因为政府以前主要治理小数据,但是在这个大数据的生态中,政府应该做怎样的调整来刺激这个新生态的发展?”
车品觉:
怎么来治理整个生态,这是一个蛮有意思的问题。中国现在有一个比较有意思的课题,就是数据资产。政府绝对是拥有数据资产最大的机构,但是今天中国对数据资产的理解太浅,有点不够重视。有些政府部门没有想清楚自己为什么要收集数据。我认为,政府部门对数据资产停留在想要有多少就有多少的阶段。这是很小数据时代的思维:占有数据,控制数据。其实只要有好的策略,政府拿到的数据会越来越多。但是我要说的是,你拿的数据多了,对社会的责任也就多了。如果你拥有这么多数据,你又不去用,那你干吗收集?但是如果你把这些数据分享出去,人家又会说泄露隐私。
而且我们要明白,政府的数据往往是一些商业领域的催化剂,这一点非常难琢磨。事实上,你根本用不着把数据分享出去,你可以根据数据建立模型,别的公司既看不到数据,又能从你的数据里获益。这才是聪明的做法。比如人民银行征信里面的数据,是不必要公开的,它只需要做一个模型跟其他模型匹配。这一点其实是人民银行该做的。
问:“除了公开政府自己的政务数据,中国政府推出的“互联网+”战略在一定程度上推动了社会上各领域数据的关联。”
车品觉:
确实是。我觉得美国这么多的总统里面,奥巴马是最伟大的。因为他是第一个把大数据推到美国国家最高战略层面的总统。奥巴马政府有自己的数据中心,有自己的政府CDO(首席数据官)。同样做这件事情的,是我们国家的领导人。中国政府也把大数据跟“互联网+”推到国家战略层面。唯一不一样的是,美国做这个事情更加开放,中国比较封闭,但是两者的力度都非常大。我说的伟大就是在这个地方,就是敢做。你看哪有一家公司现在不赌还想赢的?国家同样如此。
当然也有人会说,与其说奥巴马厉害,不如说美国厉害。其实奥巴马之前的两任总统就已经把美国图书馆里面的资料全数字化了,这些为奥巴马的大数据化做了铺垫。但是中国政府在此之前毫无铺垫,是凭空开始做这件事情的。关于这一点,做研究的人就需要想一想,中国和美国国情有何不同?我们该怎样做?
今天的数据交易还停留在“他要卖你要买”的状态
问:“政府开放数据,以及在全社会提倡“互联网+”,将显现地增加全社会数据互联的程度。但是在企业层面,正如您前面所说,很多数据“布点”都是别人布的,如何关联?是不是正是在这个背景下,数据交易在中国逐渐热了起来?”
车品觉:
今天在中国的数据交易有一点像淘宝,就是说,如果我有一堆数据,我可以跟你做交换或者卖给你。业内有很多人交流过这个问题,但是说实话,通常情况下我是不敢用这些数据的。 为什么?你今天给我一个数据,我不知道你的来源,也不知道数据会不会是脏的,我怎么敢用?每天早上八点钟之前数据一定要给到我,你能不能做到?如果不能做到,我怎么敢用?如果用得好,下一次的数据质量是否跟上次的一样?如果不一样,我怎么敢用?另外我还担心,如果有一天你突然不卖给我了,那我已经开展的业务怎么办?
如果这些都无法确定,我是真不敢用交易来的数据。但现在的数据交易,确实是都不能确定这些问题的。总体来说,今天的数据交易还停留在“这是一个沙发,他要卖你要买”这样的状态,还没有到刚才说的细节。
不过中国的事情很奇怪,有时候先忽悠,忽悠起来了就会有很多人把他的资源加进来,结果这个事情最后也能搞成。这是很中国特色的,在美国是不敢想的,但是在中国有时候真的会发生。我朋友问我,我也不敢说中国的数据交易不行。但是我知道这件事现在还很迷茫,做这件事的官员很着急,到现在还没有一个很清楚的案例能说明,数据交易是成功的。
数据拥有权的归属是个尖锐问题
问:“一个私营公司收集的数据,本身就是用户的数据,然后再卖给别的公司,这不是有问题的吗?”
车品觉:
你这个问题其实是挺尖锐的,尖锐在哪里呢?尖锐在涉及数据拥有权的归属。这个问题我们讨论了很久,政府部门也比较关心。比如说,你现在进了一个网站,这个网站说“你如果用我网站的服务,那么有关你的数据就归我所有”。你同意了,那么相当于你签了约,你使用网站或者应用的服务,网站或者应用就可以使用你的数据来改善它的设计。但问题在于,用户同意让你使用数据搞好用户体验,并没有同意你跟其他公司交换有关他的数据,是不是?之前参加一个论坛,有个人问了数据拥有权归属的问题。旁边一位刚好在公司里做这件事情的人说,“现在来说这还不是很严重的问题”。我立马回应说:“谁说不严重?”从阿里离开之后,我就要说实话。切切实实来讲,作为一个公司你有这个权力吗?
还有一点,先不说你把数据拿出去交易,就说你自己用,譬如用户注册了一个公司的网站,使用这个网站的服务。但是这个网站仅仅靠本网站的数据对用户的认知还不足够,它出去买一点数据匹配进来,就能知道更全面的信息。但是,用户有没有授权网站去认知他?这个事情应不应该告知用户,公司有没有责任?我对这种做法有一些反感。如果在美国、欧洲的话,这个事情是有一点夸张了。我这是实话实说,没有夸大。
其实大公司在这方面的问题更大。比如腾讯、阿里,事实上是一个包含非常多公司在里面的公司,政府对这种公司的处理是不是应该一视同仁?什么意思呢?我这个公司有一百个分公司,用户和任何一个公司签“可以使用数据作为服务改善”协议时,该协议是限定在这个分公司,而不是一整个集团!我想说的是,当一家公司已经大到分公司之间的数据传输也会让你恼火的时候,你不能把一家公司当一家公司看。
大公司在使用数据时应该有限制
问:“中国的BAT(百度、阿里巴巴、腾讯)收购了很多公司,收集的数据越来越庞大。所以大公司在数据的交易中是不是应该承担更重要的责任?”
车品觉:
我想说,大公司在使用数据时应该有一个限制,哪怕是公司内部的自我交换,也应该是有一个限制。老实说,今天给你讲的东西,如果我是在一个大公司工作的话就不会跟你讲,这完全违反了公司利益。但是如果从国家的立场和人民的利益来讲,这个问题还是应该提出的。过大的权力或者是过大覆盖面的公司,它们对数据的使用和小公司完全不一样,不能一概而论。 在美国这个问题已经在寻求解决方案了,不同级别的公司对数据的使用需要遵循具体的监管要求。政府已经开始对这种公司进行监管,这个监管看上去还是很简单的:就问你几句话,你们公司到底有没有合规。很多公司都有一个合规部门,是公司里面一个专门负责检查自己公司数据应用情况的部门,它会按照政府的规则去自我检查。
所以政府的监管很简单,我只找你公司的CTO(首席技术官),给你一张表填,你自己检查自己合规不合规,如果将来出了事,你等着罚。我不查你,你自查,但是一旦出了问题别怪我罚你。当然这要看企业的级别,看企业的影响级别。
问:“在中国是不是可以照搬这种做法? ”
车品觉:
我们现在的政府总是怕,害怕影响企业,担心监管会影响企业的运作。政府部门有这样的态度是挺好的,但是过于谨慎。我觉得这个怕不代表可以完全不做。我说政府这样不对的原因就是,没事的时候不敢干,有事的时候太严格。你没有给企业一个比较清晰的指引,等到出事了,政府才告诉你这不能搞那不能搞,然后十几个部门一起盯着。这是一下子天堂一下子地狱。我觉得这是政府要思考的。
我最近参加了一个美国的会议。会议用的概念不叫合规,叫企业责任,往前更进了一步,就是有大量数据的公司,要先定义你的责任。这蛮有意思的,很多国家,譬如加拿大,已经开始考虑这件事了。
问:“这个会议是谁主办的? ”
车品觉:
美国一个很大的民间团体,是由全美国大部分数据公司共同成立的一个民间机构。这个民间机构会定期组织讨论,定下规矩然后告知政府。一旦某一个企业不遵守,就会把它从团体中踢出去。这还是蛮有意思的。但是我觉得中国的协会都不是这样的,它们做不了这样的事。所以我觉得,中国政府还是需要多做一点事。一般投资项目,政府不要领投,要跟投问:“在政府开放数据,企业也合规分享数据的情况下,大数据促成的新生态势必会蓬勃发展。在这样的新生态里,政府除了开放数据,是否也可以直接投资一些项目加速整个大数据领域的发展?”车品觉:
香港政府有一个事情做得不错,但是大陆没有做。好像叫一对一,就是如果一个项目你能让投资人投,那么政府也跟着投。投资人其实是有他的眼光,我做投资人的时间还不是很长,但是我觉得他们对企业的评估,有自己的衡量,这是很专业的事情。举例来说,我在阿里有一次准备要做一个项目,一个很好的项目。然后我就找我老板。我当时的老板也是一个高级副总裁,我跟他说要给我一点人。他的第一句话是“别的部门有没有帮助你”,我说“有,有几个部门都给了我两个人”,然后老板就说“他给你两个人,我也给你两个”。后来我问我老板为什么?他说,“很简单,在一个生态里面,当一个东西好的时候,你会发现别人会看好你,自愿帮你,这个项目一定成功。别人不看好的,硬给资源一般是浪费。”
为什么会这样讲?因为大家都有一种普遍心理:我不懂,但我可以跟着懂的人去投项目。所以听说我们公司投了的项目,其他公司一定会跟投。就是说,如果几家大的、权威的投资公司投资一个项目,很多小的公司都会跟着投这个项目。
因此,政府如果跟投是可以的,不要去做主投。而且如果政府要投资,一定不要做天使投资人,天使人就是在项目早期投资一百万以下的那种。我认为政府应该是在项目有眉目的时候跟投,而不是在项目早期进入。我不知道这对不对,我只是觉得政府是很难做好这个角色的。说实在的,政府在这一点上想的还是对的,但是做得好不好还不知道,但是这个方法还是可以的。
问:“这就引出来一个比较关键的话题,政府内部分析产业趋势的智库,也是可以做政府项目投资分析的。事实上我们国家的产业政策很多时候就是这样落地的。”
车品觉:
在整个投资的过程中,投资公司厉害的地方往往是在于它的数据分析团队,分析师很厉害。所以说,政府找到的智库几乎没用。我自己就是政府的智囊,连我都没有信心看清楚的,我不觉得政府可以。我问过美国的朋友一些关于政府投资的问题:政府该不该抢风投这碗饭?如果其他人不投,政府该不该领投?该不该和私人机构竞争?这些问题,他们也没有确切答案。一般投资项目需要投资方法——政府不要领投,要跟投。除非我们看到的项目是非常底层的项目,这样政府可以早一点参与。就是说如果这是一个基础建设,政府可以砸一点钱,政府主投。但是一定要有私人的投资者跟投,如果私人投资者不跟投,那么政府也没必要继续砸钱。因为政府主投的项目是相对有优势的,但私人机构经过分析不投资的话,那么这个项目肯定存在一些问题。
就大数据这个领域而言,前面说了政府的作用是催化,是鼓励,而不是投钱。连私人投资都不投的(一般投资)项目,政府居然投资了,那肯定是有问题的。
中国现在很需要有首席数据官
问:“按照您的看法,政府不便直接投资项目,那么政府在“大数据+人工智能”的新生态中,主要责任是不是就是开放政府数据,这件事该如何施行,政府在其他方面还可以有什么作为?”
车品觉:
我想说,现在政府都很急于把大数据往前推,但是很多时候都是想着立即解决问题,但其实,政府有什么样的数据,什么能开发什么不能开发,哪些数据开放之后对整个社会有帮助,哪些数据跟别的数据进行关联才有用,这些问题都是需要通盘考虑的。也是在这样的理解基础上,我认为中国现在很需要有CDO,美国每一个州都应有一个CDO(首席数据官),白宫已经有一位CDO。这样一个角色非常重要,因为尽管我们很多人都是做数据的,但还是隔行如隔山,譬如我在阿里数据委员会的会上经常讲,我自己最懂的还是电子商务数据,旁边做物流的数据我也要请教才了解,对于整个国家来说,系统处理各方面的数据显然要难得多。所以我认为一个国家、每一个地方都应该有一个CDO,而且要尽快。
譬如用上海做例子,上海能不能有一个CDO,真的是在上海市长之下做这个CDO,帮市长处理各部门之间的数据?
我在阿里时做的最后一件事情,就是建立阿里的公共数据,现在我的部下还在继续做,其实这个事情挺有意思的,但是一定要一把手支持,要不然做不了。政府部门也是一样,在一把手支持下打通各部门的数据,把各部门数据变成公共产品给政府各部门使用,然后部分公开给企业用。这里面有一个麻烦的地方,每一个部门都有自己的数据,但都不想公开,所以这就是为什么要一把手支持。
问:“如您所言,政府应当设立专门的CDO职位,帮助一把手统筹处理各方面的数据。但是从国际经验来看,以及在国内一些地方的实践来看,政府部门的开放以及如何处理开放数据带来的系列问题,其实工作难度都是很大的。”
车品觉:
所以如果上海设立一位CDO,他要做的事情,就是必须把数据聚起来,不要各个部门说有什么隐私问题,而是说我这个CDO的职责就是保护你的隐私的,所以你的数据要放到我这里。在阿里,公共数据的处理,我们自己有一个中央部门去负责;在上海,数据的处理,也应该有市长批复,有CDO批复。隐私的问题,交给我中央部门来负责。我在阿里怎么评定数据的使用,第一有没有隐私事情,第二有没有影响到国家利益以及我们的企业利益。我就做这样的决策人。政府的CDO也应该是一样的。
上海最有能力做大数据生态治理的样板
问:“CDO的职责不只是开放数据,但仅就开放数据而言,在机制方面您有什么可以建议的?”
车品觉:
我觉得还是应该找一个标杆,有一次见成都的市长,他说了一句话,如果成都医疗的数据全部开放,你能做吗?当然这些话有后话,你怎样保护安全,你怎样防止泄露?这肯定是一个前提。只是说领导的想法就是你要什么数据,只要国家安全跟隐私可以保护,就都可以给你用,你们去想办法就行,只要你们有办法,数据我一定开放。 这种思路和美国政府稍微不一样,美国不是只给你一家用,你跟政府要求说要某一种数据,政府会考虑给你,但是如果开放了,就不是只放在你口袋里,也要给别人用。所以政府数据门户网站上开放的数据,最好不是政府觉得应该开放的数据,而是企业觉得有用的数据。不是政府说应该挺喜欢天气数据就放一个天气数据,而是应该有商业逻辑在里面。每一个开发出来的东西其实必然是有一个面向需求的开发。
问:“除了开放数据,CDO还应当有什么样的职责?”
车品觉:
如果要开放一些数据,那么政府应该让谁去评定应不应该开放,这个委员会在哪里,用什么机制开放出来,这是CDO的首要责任。另外就是投资,如果有人准备在上海做大数据方面的创业,到底政府应该怎么帮他们,这也很重要。当然还有一方面前面已经提到,就是对企业在数据互联中出现的问题进行判断和处理。 问:“大数据的生态治理,给政府治理带来了新的挑战。您觉得国内各地方政府这方面的施行情况如何?”
车品觉:
我觉得上海可能是最有能力做样板的地方,要全国做太难了,如果上海做不成功,不要期望别的地方可以做成,但是如果上海要做,千万不要学某些地方只做门面的东西,这个门面东西只是给上面看,连自己都不相信,这会影响到当地的利益。 上海官员其实还是挺开明的,有一次负责信息化的一个部门让我去评智慧城市的项目,给我看了一本很厚的材料。我当时跟负责人说,“一定干不完”。我看里面的内容很多是把以前十几年老账翻出来,然后包装成一个智慧城市,是大家都奔着智慧城市这个名字,把以前干不出来的东西都套进去,而且你这个专家评审只给我五分钟发言,怎么够?后来这个负责人听进了我的批评,之后的评审会不仅又让我来,还把上海市民找来,三百名,一起讨论。所以我觉得上海的政府官员还是挺开明的。
人才的稀缺比数据稀缺更加恐怖
问:“除了政府的治理水平,在市场创新方面,您觉得什么是大数据的生态发展中最重要的要素?”
车品觉:
其实最近两三年中国的数据人才是不够的。最好用的人往往是做数据已经有五年经验的人,数据的经验积累还是需要的,毕业五年之后是最好的,所以现在有非常多的创业公司,但是没有足够多的人才。人才的稀缺其实比数据稀缺更加恐怖,很多人以为数据稀缺是第一困难,其实人才是第一,数据第二,第三才是生态。人才到中国,第一件事情是看有没有好学校,小孩子怎么办?国际学校很重要,因为这意味着五年后是否还有可能回美国,五年后怎么与美国接轨?有些海外人才很喜欢中国,但是问他“子女要读书,你会把他送回美国念书还是在中国”,他就卡壳了。在杭州,阿里最头痛的就是,请那些数据科学家过来之后,他们一看幼儿园发现没有一家比较好的,国际学校也几乎没有,只有一家但是跟上海没办法比,就打退堂了。北京的话,人家一看雾霾就不想了。配套设施其实就是上海好,什么东西能吸引世界人才,世界人才就会到那个地方。
所以政府对大数据的支持,与其直接给公司投资,还不如做些这方面的工作,千万不要像以前那么笨,直接给好处、给公司好处。
第二个最重要的是,对搞大数据、人工智能的人来讲,旁边那个人是不是高手很重要。人才都要在高手的环境生态里面。譬如我以前的分析师团队,可以说中国分析师团队没有比阿里厉害的,因为旁边那个人很厉害。硅谷为什么会厉害,因为它要解决一个问题的话,旁边就有他需要的人。
这个事情可以学习新加坡。我记得当年香港政府的一个人来我办公室,问阿里巴巴能否在香港做一个数据研究所,我说你可以给我什么?他说“我们政府没有给这方面政策”,我说我作为香港人很想帮助你,但是你要有政策才行。我告诉他们新加坡是怎么做的,新加坡的处长每两个星期都会来我办公室回访。新加坡给钱、给人、免税让我们过去。他们的官员真的是每家大公司去拜访,找机会让你在新加坡落地,哪怕是只有一个小办公室。我觉得新加坡做得真的很好,他们官员的积极性真的很高,他们很希望自己可以成为亚太区的总部。
上海和香港最有机会成为全球数据特区
问:“如您所言,如果一个地方的政府治理水平有保障,同时能够吸引人才的流入,那也就意味着大数据生态在一个地方的健康发展。就您的观察,大数据在各地蓬勃发展,各个地方也都千方百计希望能够脱颖而出,您认为哪里最有可能成为大数据这一新生态中的关键区域?”
车品觉:
我觉得上海是非常有机会的。我有个想法,是不是讲出来我有一点犹豫,是什么呢?我正在大力帮香港政府,希望把香港变成国际性的数据中心,但是和你聊,我觉得上海也具备这样的实力。因为上海有条件跟香港不一样,如果中国选地方做成国际数据中心的话,我觉得只有香港和上海是靠谱的。 因为现在每个国家都保护数据,数据是不能出国的,美国公司的数据不能出美国,俄罗斯公司的数据不能出俄罗斯,中国公司的数据不能出中国。但是作为国际企业怎么办?很简单,哪里法律允许就去那里。有没有一个特区可以让数据放进去,让全世界都放心把那个数据放在那里做交换和交叉?这有一点像一个安全港的意思。我的意思就是,上海可不可以成为一个这样的特区。
其实这个优势香港也有,也不一定这个世界只有一个数据中心,中国也不一定只有一个,为什么不能有两个?我觉得,上海、香港两个自己跑,谁能赢谁?现在要说服的不是中国政府,而是美国、欧洲,让它们相信可以把数据放进来。
如果不行呢?可能要跟“一带一路”联系起来。我们不一定能说服美国、欧洲,但是我可以说服“一带一路”的国家。能把这些国家的数据放在上海或者香港,也是不错的。
作者为上海市科学学研究所副研究员。文章为作者独立观点,不代表主办机构立场。
来源:微信公众号 三思派(ID:Science-Pie)
本文为专栏文章,来自:车品觉,内容观点不代表本站立场,如若转载请联系专栏作者,本文链接:https://www.afenxi.com/36066.html 。