摘要:拥有大数据的理念,能够掌握数据和运用数据的人,就是下一个时代的魔法师,反之,你就成了麻瓜!
一件印有电子科技大学字样的文化衫,是周涛的标志性穿着。即使是在向李克强总理汇报时,他也依旧穿着文化衫,这让80后的他看起来更像个学生,而不是已经有无数光环和成果的教授。
翻开他的履历,就会发现从小被称为天才神童的他有多么不一般。1岁说话,1岁半识字,2岁学象棋,3岁打麻将,4岁看武侠小说……26岁获得教育部自然科学一等奖,27岁获聘电子科技大学正教授,29岁获得中国青年科技奖。
他是数据少帅,担任电子科技大学大数据研究中心主任。2015年,他当选为“年度科技创新人物”,颁奖辞是:周涛用大数据分析的新视角,重新审视我们所面对的这个世界,他带领一群年轻人,在“大众创业,万众创新”的道路上,迈出了自己坚实的脚步。在大数据挖掘与分析,特别是网络数据的挖掘与分析方面做出了系统性的贡献,其创新成果解决了重大科学问题,突破了关键核心技术,产生了重大社会经济效益,显著改善了百姓生活。
为数据而生的魔法师
三年前,周涛翻译完成畅销书《大数据时代》。三年之后,周涛又出了一本书。在翻译《大数据时代》之前,他就想写一本关于商业案例应用的书,这个理想终于实现。
“在麻瓜和魔法师之间作出选择”,这是周涛在新书《为数据而生》中的自序标题,也是他给读者们的忠告。时代在飞速发展,所有的行业都可能被颠覆。“拥有大数据的理念,能够掌握数据和运用数据的人,就是下一个时代的魔法师,反之,你就成了麻瓜!”
周涛虽然一直在学校任教,从事数据挖掘和复杂性科学研究。但是他认为,只做研究远远不够,大数据领域必须有魔法师,让大数据和产业结合才能发挥其价值。
“任何一个垂直行业都有说不尽的大数据应用。比如可以用大数据技术帮助银行找到信贷中的违约客户进行提前预警,我们不仅关注企业是什么类型、在什么地域、账户上平均有多少钱等等这些初级特征,还关注企业间社交关系等高级特征,最终可以大幅提高预测的准确度。这给银行带来的是翻天覆地的变化。”
他在很多大数据公司担任首席科学家,在2012年创立数之联集团,帮助政府实施“智慧城市”战略,同时也为企业在金融、营销、人力资源等方面提供大数据服务。目前,他创立、联合创立和投资的大数据企业市值已过百亿。
这些实践让他总结出不少大数据行业应用经验。今年4月,李克强总理参观国家信息中心大数据创新创业基地,周涛就大数据在金融、医疗等重点行业的应用等问题做了专项汇报。
他在汇报中说,国家信息中心与电子科技大学正在筹建一个“用大数据手段辅助政府决策”的智库机构,希望得到总理及相关部门的支持。
总理回答:“要把新经济指数和双创指数做成决策重要参考依据。你们做的这个非常重要,如果发改委没有专项经费,可以用我的总理专项基金支持。”
驱动大数据创新3.0
大数据概念刚进入中国的时候,大家都为之兴奋,但周涛认为:“我们要清楚地分辨出,哪些是真正的大数据创新,哪些只是传统的数据挖掘、商务智能套上了大数据概念。”
从收集应用自身数据的大数据1.0 时代到现在,我们已经进入了数据、技术、需求和人才等大数据创新要素融为一体的大数据3.0时代。“大数据创新用一个词来总结,就是分析,比商务智能时代更深刻的分析,可以用更好的分析代码来分析数据。”
在电子科大,周涛和他的团队做了一件事情——寻找校园中最孤独的人。他们研发出一套“学生画像”大数据系统。仅仅通过校园一卡通追踪学生行为轨迹,就能“算”出每名学生的学习、生活状态,发现学生在学校有多少亲密朋友。
“我们找到了800多个最孤独的人。他们平均在校两年半的时间,一个死党都没有,这是一件很可怕的事情。”周涛分析,数据表现出这些学生存在一定的社交障碍,这些人中17%的人可能产生心理疾病。
通过这套系统,不仅可以及时预测预警学生异常状况,还能总结出优秀学生的行为模式,为学校的决策提供数据支撑。比如,根据学生就业能力情况,学校及时开展个性化引导,提升学生就业水平;根据学生实际消费情况,找出隐性困难学生,实施人文关怀等。
这项针对在校大学生行为的大数据研究,是教育部网络文化建设示范性项目中的亮点。
而这样的行为数据研究,还有着更广阔的应用市场。“中国意识到大数据的价值并不比欧美晚,但目前没有真正很好的大数据应用,其中的一个原因,是拥有大数据的人,拥有大数据分析技术的人,和拥有数据分析需求的人是分离的。我认为大数据10年内的商业模式巅峰将是数据的集成,或者用更性感的词,叫数据运营商或者数据交易平台等等。”
作为中国大数据领域的领军者之一,周涛正不断探索着大数据的商业应用创新和集成,推动数据从开放到应用的生态发展。为此他还创立了数据竞赛平台DataCastle,寻找有潜力的年轻人们。
“我们相信,未来肯定是属于90后、00后的,我们真正要做百亿千亿万亿级别的事情,需要更大的平台把这些集结起来。”
对话周涛涂子沛频道:关于大数据,您职业生涯中印象最深刻的一件事是什么?
周涛:我印象中最棒的事情,就是看到自己参与的研究成果在真实世界的应用。举个例子,若干年前,我们给中国移动在某城市做服务,选择一部分种子用户做红段子转发,使用的是我们自己设计的LeaderRank算法。当时真的很忐忑,因为理论研究效果好往往只是一种意淫。结果,我们选择的种子用户转发效果远远好于移动公司原来的方法,那种理论研究竟然真的有用的感觉实在非常棒。后来之所以参与了一点点商业化的事务,也是想重温这种乐趣。
涂子沛频道:关于大数据,您正在进行的工作是什么?
周涛:三个方面。第一是比较基础的问题,就是大规模真实数据统计中遇到的一些基本性的问题,包括怎么对特殊的数据集(例如网络)进行抽样,当真实数据集的分布的有限矩发散的时候,怎么计算和评估其他统计量。第二是我自己做了快10年的老问题,就是图的挖掘(Graph Mining),包括链路预测、节点重要性排序、个性化推荐等等。第三就是如何通过真实数据,去刻画真实系统,发现和解释新的现象,包括经济系统的周期、泡沫和风险,例如文化的形成、演进和传播等等。
涂子沛频道:对于大数据的未来,尤其是您正在从事的领域,您有什么样的展望?
周涛:我认为在统计学和算法方面会有非常大的基础性的变化。前者会出现新的抽样理论(譬如对于网络、空间移动轨迹、时间序列等如何抽样)和在放弃稳态假设、正态假设等等前提下的新理论;后者会产生大量流数据的算法(不依赖于数据整体)和相应的算法分析,可能以后很多算法复杂性里面我们看不到大N的影子了,因为计算机都看不到整体的N。
本文为专栏文章,来自:涂子沛,内容观点不代表本站立场,如若转载请联系专栏作者,本文链接:https://www.afenxi.com/16762.html 。