摘要:有价值的数据来自于交易和共享,而大数据必须跟行业结合才会产生价值。对于交通而言,其问题在于产生拥堵、安全问题与环境问题。那么,交通由数据来驱动的话可以在哪些方面有所作为呢?可以想到的有交通运力设计、路网线网设计、生活设施配套、以及城市规划设计等。而要让数据真正流转起来,需要将交通数据的拥有方、应用方、以及加工方整合到一起组建一个交通数据交易平台。
我近期接触的 “TDEP” 就是这样一个交通数据交易平台,其整合了交通数据拥有方 “华视互联”,它是户外数字电视广告联播网 “华视传媒” 旗下的子公司 “华视互联”,其主要专注于公共交通 WiFi 的建设与运营(你见到的公交、地铁上的广告就是华视互联出品);以及交通数据加工方 “深圳北斗应用技术研究院(SIBAT)”,它是中科院深圳先进技术研究院与深圳南山区政府共同筹建。
TDEP 负责人告诉 36 氪,华视互联目前已经覆盖了 99 个城市,覆盖了 18 万多辆公交车,目前有 1000 万 + 注册用户,覆盖人数 7.3 亿。作为交通数据拥有方,华视互联每天可以产生 80 多 G 的新增数据,新增 GPS 数量为 3.08 亿条,每天网络流量为 1 万 G,同时每天新增用户为 8 万人。
前期以华视互联的交通数据为基础,通过数据采集、对接数据接口,构建一个数据供应商联盟;之后,数据再过手 TDEP,对采集来的数据进行数据质量认证、数据价值评估、以及数据定制服务;最后,数据经过清洗、分析、挖掘后,再流转到包括政府、学校和科研机构在内的公共客户,以及大型企业客户和中小企业 / 个人客户手中。
TDEP 负责人告诉我,简单说,交通数据从拥有方到客户手中主要需要通过以下流程:数据获取、数据分类、数据质量认证、数据价值评估、数据上架、数据交易、交易支付、以及售后服务等。
其中数据质量认证主要有以下几个评判标准:从分类上来说,交通数据包括实时、历史、静态数据;以及公交车、出租车、货车、客运车、电动车、地铁、私家车、自行车数据;GPS、IC/RFID、CDR、WIFI、路网 POI、环境数据。从评分系统来说,则要检视数据的准确性、合规性、一致性、重复性、及时性、完备性,并利用信息熵指标建立交通数据准确性和完整性等的质量评价体系。
总的来说,数据质量评估指的是在较低的采样率和不同时空尺度下,解决数据质量中的不确定性问题。这又包括以下几点:
时空数据质量评估:利用信息熵指标建立时空数据准确性和完整性评价体系;
异常数据检测:分布式数据挖掘算法将大数据中对数据决策系统造成干扰的噪声剔除(约 40%);
可用性评估:根据时空数据质量评估体系建立数据可用性评价体系,建立应用与数据质量的对应关系。
在对交通数据的价值评估上,则可以根据交通数据质量认证体系建立数据可用性即价值评价体系,建立数据应用价值与数据质量的对应关系。其价值评估主要包括在导航、物流、城市规划、选址、城市服务、零售等领域的应用。
得到数据并进行加工后,TDEP 还需要为这些数据找到买家,即它需要具有多维度数据利用及增值服务变现能力,针对行业、城市服务、用户画像进行精准营销。同时,对这些数据,TDEP 还有一套安保和运维服务,即对数据进行加密、保障数据安全,其使用了中科院的超级计算机平台,有 7*24 小时的运维服务。
作者:Nicholas(微信 KatherineLWong) 我是 36 氪汽车记者,欢迎与我切磋讨论。
本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。