背景:国务院印发的《促进大数据发展行动纲要》(以下简称“纲要”)主要任务第一条就是加快政府数据开放共享,推动资源整合,提升治理能力。
纲要针对“数据开放”做了详细的表述,其中包括“制定公共机构数据开放计划,落实数据开放和维护责任,推进公共机构数据资源统一汇聚和集中向社会开放,提升政府数据开放共享标准化程度,优先推动信用、交通、医疗、卫生、就业、社保、地理、文化、教育、科技、资源、农业、环境、安监、金融、质量、统计、气象、海洋、企业登记监管等民生保障服务相关领域的政府数据集向社会开放。”
对于大数据产业链条上的所有“玩家”来说,数据开放与数据流通以及数据共享意味着可获得更多的数据资源,同时,开放政府数据能全面促进小微企业发展,带动就业,开辟新战场和激活经济。数据开放的重要性不言而喻,它是整个中国大数据“火箭”的助推器。那么数据开放与数据流通以及数据共享目前进展到哪一步了呢?
带着这个问题,近期走访了北京一家专门做数据开放、数据流通解决方案的新创企业——北京因特睿软件有限公司(以下简称因特睿),并当面专访了这家公司的联合创始人兼CEO张颖博士。
北京因特睿软件有限公司联合创始人兼CEO 张颖博士
划重点:
1、2017年,所有的大数据企业都需要面临自资本市场的更大压力和挑战,如何更有效地实现大数据的客户价值与商业价值,探索更加有效和以价值创造为导向的收入模式。同时数据资产权属、数据资产安全与控制将成为2017年大家所关注的核心问题之一;
2、燕云DaaS目前已经在22个省份、200多个项目中得到应用;
3、燕云DaaS不直接从数据库入手,而是从业务层面入手,在数据字典梳理的同时,生成数据访问接口,一举两得;通过“数据接口的重建、重组、重生”实现数据应用能力、业务能力的扩展和创新。
4、燕云DaaS承继北大软件所的软件体系结构重构的技术积累,致力于“让天下没有不联通的系统,没有不被共享的数据”。
5、智慧城市是信息技术推动下城市建设的必然产物,是工业化、城市化、信息化的深度融合的体现,只有将信息技术、信息资源融合到城市建设过程中,才能更好地满足城市建设发展的需要。
下面是详细的专访内容:
在刚刚结束的2017第七届中国智慧城市大会上,您获得了“中国智慧城市杰出贡献人物”并被聘请为智慧城市规划委员会专家,我们想问一下,对于智慧城市的建设,燕云DaaS有什么特别的贡献?
张颖博士:智慧城市是信息技术推动下城市建设的必然产物,是工业化、城市化、信息化的深度融合的体现,需要将信息技术、信息资源融合到城市建设过程中,才能更好地满足城市建设发展的需要。
我国信息化建设30多年以来,各个城市、单位、部门都积累了大量IT系统,有做业务的、有用于办公的,种类繁多且在持续稳定可靠地运行着。这些系统中产生了大量宝贵的数据资源。但由于历史、技术、开发团队缺失、协调不畅等原因,这些信息系统却成为一个个的信息孤岛,它们中蕴含的信息资源不能很好的融合、共享和交互。燕云DaaS就是技术上主动突破信息孤岛壁垒的一把利器,它能在无原开发商配合、无源代码、无数据库开放等条件下,将原系统所提供的业务功能和数据开放为接口(也就是常说的API,Application Programming Interface),为系统之间的互联互操作、多源数据汇聚提供强有力的支撑,是真正意义上的基于业务层面实现数据、功能整合,无缝集成、资源汇聚的工具和平台。
燕云DaaS产品的应用情况如何?它最常见的应用场景是什么样?这些客户都有什么特点?
张颖博士:燕云DaaS推出仅1年时间,已经在数个省份200多个项目中得到应用,成为多家特一级、一级企业的合作对象,市场反响非常强烈。可以说燕云DaaS是一个兼容并蓄、推陈出新的产品。它有强大的整合能力,所以恰到时机的弥补了大数据时代数据从产生到流转,从流转到消费过程中所存在的断层。
也正是因为强大的功能,燕云DaaS的应用场景极为广泛,在政府领域涵盖“一号一窗一网”建设、“智慧城市”建设、社区“网格化”建设、不动产登记、“金字工程”等多种场景,在企业市场,也涵盖了财税、办公、生产制造、销售、客户服务等多种场景的应用。 我们的客户,小到使用SaaS服务的小微企业,社区服务站,大到国家部委、大型央企,都有涵盖。可以说所有与数据相关、与信息化建设相关的企业,都是我们可以服务的对象。
数据API经济与大规模数据流通
燕云DaaS主要解决是数据流转、数据开放的问题,数据开放过程中最大的难题在于“数据安全”,燕云DaaS是如何去解决这个问题的?
张颖博士:“数据安全”是一个重要,并且复杂的问题,也是客户最关心的问题之一。
燕云DaaS在对给定系统生成API以及支撑API运行的过程中,会完全遵循原始系统的安全访问体系,同时,根据对数据的产生、传送和消费这样一个完整生命周期进行纵向拆解,又横向地将安全问题划分为物理层、传输层、应用层三个层面的问题,通过这种网格化的划分方法,燕云DaaS搭建起了一个分级、分层的立体的安全防护体系。并且分别针对体系内的各个环节和层面进行了多样化的安全加固和管控。
我们了解到,因特睿刚刚完成了支持贵州大数据共享平台,建立数据目录的项目,可以详细和我们说一下这个项目吗?因特睿是如何完成的?
张颖博士:贵阳作为首个国家大数据综合试验区,在大数据开放共享建设中一直走在全国的前列。数据目录体系构建,是建设数据共享交换平台的基础。传统的方法是从底层数据库、数据表、数据字典着眼,由业务人员、开发商、IT技术人员等多方面配合,靠人工将数据库表与业务系统功能进行比对、查找,形成数据目录清单,此方法不仅耗时、耗力还容易出错,而且梳理者不仅对业务熟还要对系统逻辑及数据结构、数据字典熟,否则就有可能梳理不出来。
由于燕云DaaS的独特技术特点,我们反其道而行,从业务应用层面着眼梳理数据目录。不直接从数据库入手,而是从业务系统使用者的角度,生成数据访问接口,同时完成数据字典梳理,一举两得。需要协调部门少,生成数据采集接口之后再通过配置、设置支持数据项的分级分类、一数一源、多源校核的清洗,以及脱敏脱密。
我讲一个数字大家就会看到:我们在梳理试点工作中,仅一周时间,在无原系统开发商配合、无需数据库开放、缺乏数据字典的前提下,成功完成住建、人社等5家单位19个系统836个功能项的梳理,形成162个数据目录字典,以数据接口(API)作为载体,生成政府各业务系统的数据台账,并可按需、实时、准确、完整地获取相应原业务系统的数据,成效十分惊人。
燕云DaaS产品在技术上的最大创新点是什么?除了在政府信息化建设、一号一窗一网建设等领域,对于有较大分布式架构集群(如Hadoop)的企业来说,燕云DaaS如何配合分布式架构完成数据流通和流转的工作?
张颖博士:燕云DaaS产品基于北大提出的运行时体系结构重建技术,通过计算反射和内存分析,能够快速安全地重建出给定系统的业务数据访问接口。无需原开发商配合、无需源代码、也无需数据库开放,即可实现数据实时获取、精准融合和无缝集成。这种技术颠覆了传统的信息孤岛资源开放以数据库为着眼点的思路,开辟了新的数据集成、融合模式,在“数据接口的重建、重组、重生”上,实现数据应用能力、业务能力的扩展和创新。
Hadoop集群是目前处理数据的一个常用架构。燕云DaaS所提供的API可以方便的与其融合,替代其从文件系统中读取数据的方法。
当然,从燕云DaaS自身角度来说,既支持集中化部署,也支持分布式部署。在分布式部署架构中,将燕云DaaS运行平台分别部署至各个分布节点,由燕云DaaS管理平台统一进行集中化管理、部署、安全监测、访问控制等功能。燕云DaaS管理平台提供的全局统一的DaaS管理视图,并且在API调用运行层自动实现多节点间的负载均衡及高可用保障等功能。
数据开放,让数据源像石油一样流转起来
在您开来,政府数据开放,能产生哪些价值和利益?如何看待数据开放?难点是什么?
张颖博士:政府向社会公布自己所拥有的,并经过脱敏的数据。包括天气数据、GPS数据、金融数据、教育数据、交通数据、能源数据、医疗数据、政府投资数据、农业数据等。这些原始数据本身并没有明显的商业价值,但经过一些公司加工之后,可以产生巨大的商业价值。
在关键的数据开放共享环节,除了按照《促进大数据发展行动纲要》相关要求推进数据开放共享的标准和制度完善,还由于各种系统中数据多源异构、标准不一、源代码缺失、数据库封闭与开发团队缺位等问题,导致大量分散的信息孤岛阻碍了政务数据的开放和共享,亟需强有力的技术手段主动突破信息孤岛壁垒,实现高效的数据开放、共享和交互。
燕云DaaS和爬虫软件有什么不同?区别是什么?
张颖博士:区别有如下几点:
适配范围的区别:传统爬虫,只能从BS结构的简单web页面抓取数据,对对于复杂B/S系统、C/S系统,以及App等就无能为力燕云DaaS则能很好地适配这些类型的系统。读写能力的区别:燕云DAAS不仅可以生成给定系统的“读”接口,还可以根据用户的授权生成“写”接口。而爬虫通常只能读取数据。时效性区别:爬虫技术通常是定期爬取数据,而通过燕云DaaS提供的API,则可以实时程序化地获取给定系统提供的数据。内容格式区别:爬虫爬取的都是原始数据,通常要二次加工才能使用。而燕云DaaS提供的API可以按照客户需求进行规整化,且内容可直接过滤清洗而得到最终呈现。架构区别:燕云DaaS以微服务的方式独立运行于业务应用之外,且不会像爬虫一样对所有页面都去爬取,因而对原始系统服务器的压力也会小很多。
之前报道了燕云DaaS后,红杉资本、达成创投这样顶级的投资机构也分别问过我们,想问一下目前因特睿的经营情况,近期有没有融资需求?
张颖博士:2016年,是因特睿市场正式推广的第一年。围绕“互联网+政务服务”、“数据开放共享”、“社区网格化管理”等关键场景,完成了产品研发、配套方案的设计、典型实例验证等工作。在公检法、国土、教育、电力、石油等行业,分别取得了灯塔项目。关于融资:公司于2015年末完成了Pre-A轮融资。公司对于下一轮融资的态度是开放的,希望在2017年完成A轮融资,以支撑产品门槛的持续积累及市场的培育和发展,目前在跟一些主流的投资机构在接洽。
如何看待大数据产业去年的发展?对于2017年你有什么展望?
张颖博士:这个问题很大。我觉得不要去谈大数据,而就谈数据,就谈信息化。云计算的基础设施和数据的开放共享都在2016年进一步推动了信息化建设。然而以大数据为标签的新型信息化要真正看到效果,还有很长的路要走。
现在动辄谈有多少数据,谈数据交易、谈区块链这些热词,我个人认为不是一个良性的发展状态。大数据还要看应用。从数据应用的角度,可以将大数据发展分为:描述性、预测性、指导性三个阶段。描述性阶段关注“发生了什么”,并呈现事物的发展历程;预测性阶段关注“可能发生什么”,呈现事物的发展趋势;指导性阶段关注“选择做什么”,呈现不同决策的后果。如果我们不能知道已经发生了什么,就要去做出可能发生什么、甚至要做什么的判断,肯定是不现实的。
因此。 个人认为大数据产业需要从实际需求出发,从落地应用出发。像“单一窗口”这样一个服务老百姓的应用做起来了,大量老百姓用起来了,数据不断积累起来,数据反馈应用改进,反馈上层决策、百姓评判了,又有更多人用起来了,大数据典型应用也就成了。当有越来越多的大数据典型应用被越来越多的人用起来时,大数据产业也就成了。
对2017年,我希望大数据发展能更落地一些。我们因特睿作为“数据管道”这样一个基础设施提供商,会继续踏实地帮助应用集成商从蕴含丰富数据的各式IT系统中汇集数据、实现系统互通,从而助力他们在应用层面更快更好地创造出价值,让老百姓真正享受到数据的便利、享受到信息化的便利。
关于张颖博士
张颖,男,博士,北京因特睿软件有限公司联合创始人兼CEO。曾获得教育部高等学校科技进步一等奖、中国计算机学会优秀博士论文奖,并入选中国科协首批”青年人才托举工程”。率领因特睿团队研发“燕云IaaS”和“燕云DaaS”系列产品,以API为核心,突破系统之间功能互联互通、数据共享融合机制。其中,燕云IaaS是市场上率先具备x86服务器和非x86小型机异构管理能力、也是首个具备智能终端资源管理能力的私有云管理系统,被联想集团和方正集团OEM成官方产品。燕云DaaS已成功服务于深圳坪山新区一门式综合受理平台、武汉硚口区互联网+政务服务体系信息化服务等多个大型项目,有效带动大数据生态建设,高效推进了大数据应用的真正落地。
本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。