通过“观数”实现“观人”,观数科技深挖社交数据实现用户精准画像

通过“观数”实现“观人”,观数科技深挖社交数据实现用户精准画像

在一个数据缺乏的市场提供数据服务,是幸运也是不幸,幸运的是市场中充满了机会,不幸的是市场上缺乏基本的数据源。

这是国内每一家数据公司所面对的基本情况,因此到底是自己挖掘数据源,还是利用已有数据源来开发模型,就成为一个重要的选择。观数科技更倾向于前者,虽然观数也有模型类的产品,但其核心能力在于对社交数据的爬取和处理。

观数对于社交数据的处理有两个特点,其一是其系统不仅可以爬取人人网、微博等社交网络的 web 端数据,还可以做到对 App 数据的爬取;其二是观数将多平台数据进行关联,通过对好友关系、兴趣爱好、标签群组等信息进行建模,可以做到识别用户身份 DNA,对用户进行画像。目前观数在全球拥有 100 多个分布式节点,拥有每天 5000 万次的数据获取能力,每天可以处理 10TB 数据。

观数目前有三个面向用户的产品:法眼、天眼和慧眼。

作为一家定位于大数据的公司,观数最主要的产品是法眼,这是一套针对小额信贷风控的征信产品。观数一方面利用自己的社交数据处理能力为用户画像,一方面也接入众多第三方数据,向用户提供电话黑名单、购物黑名单等查询功能,同时观数自主开发了一套信用评估模型,可以对借款人信用进行评估。

市场上从事征信的除了8 家有牌照的征信公司,还有91 征信小信用等等。观数科技的创始人李科说,长远来看征信肯定是观数希望做的事情,但是目前牌照申请比较困难,现阶段观数将自己定位为数据服务商,如果未来国家对征信业务出台更严格的限制性门槛,观数也许会选择与 8 家征信公司进行合作,为其补充数据维度。

社交数据并不是征信过程中最重要的元素,我们很好奇为什么观数选择从这一角度入手。李科向我们解释说,像财产、学历、工作、通讯、电商这一类重要数据都是私有的,需要客户进行授权,而在非授权数据中,社交产生的大量公开信息对征信也很有意义,美国也有利用 Facebook 和 Twitter 数据做征信的公司。针对不同的场景、不同的借款人,社交数据在模型中的权重是不同的,说到底社交数据是一个征信元素,是个人征信的基础数据之一。

天眼产品就是观数自己研发和使用的爬虫系统,观数对此申请了著作权,并希望可以将其输出变现。目标用户是有数据收集和处理需求的机构,例如国税机关,其可以利用天眼监测注册公司股权变更等信息,以更好的实行税务稽查。

慧眼产品是一个用户画像系统,根据不同用途可能会有不同的指向性。例如对于投资理财用户,其画像主要是进行职业和收入的预测以及风险偏好和投资意愿的判断,目前其职业预测准确率可以达到 80%。目前慧眼产品没有进行收费,观数希望通过免费向合作伙伴开放产品,一方面帮助合作伙伴完善用户信息,另一方面自己也进行数据的积累和模型的校验。

观数科技曾于去年9月 获得深圳新富集团 1000 万人民币天使投资,创始人李科曾参与国家 973 课题,任奥组委、世博局特聘安全专家,国家计算机病毒防控工程实验室理事,同时是椒图科技有限公司创始人。

本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。

(0)
张乐的头像张乐编辑
上一篇 2016-02-20 06:00
下一篇 2016-02-21 05:00

相关文章

关注我们
关注我们
分享本页
返回顶部