前几年,外界关于大数据的讨论沸沸扬扬。不过在陈运文(以下简称陈)看来,这些讨论雷声大雨点小,落实到应用层面的并不多。
那个时候,陈还是盛大创新院的成员,在院长陈大年的召集下,这里聚集了众多陈景仰的计算机人才,如潘爱民、陆坚博士等。在创新院里,负责数据挖掘的他还结识了许式伟、季昕华、黄伟等技术牛人。
进入2015年以后,有一段时间,生活安逸的陈觉得有些彷徨。与陈在创新院同期的小伙伴们,都先行创业:许式伟创办七牛云存储,季昕华创办UCloud,黄伟创办云知声,他们在圈内已经有所作为。
2015年夏天,陈也决定带着团队十几个兄弟一起创业,成立大数据服务公司“达观数据”。
“达观数据”的客户群主要为电商、新媒体、视频、金融等类型企业,通过SaaS形式,为其提供推荐系统、搜索系统、数据分析平台、数据预测系统等大数据服务。上线3个月以来,“达观数据”已经与十多家企业展开合作。
注:陈运文已确认文中数据真实无误,铅笔道愿与他一起为内容真实性背书。
建立大数据团队
在复旦读博期间,陈十分喜欢研究机器学习算法,多次在国际期刊上发表研究成果。毕业后,陈先后在百度、盛大、腾讯任职,从事大数据算法研发的工作。
“比起在学校,工业界的大数据研究挑战更大,在100毫秒内从几百亿条数据中挑选出优质结果,感觉很有意思。后来在盛大创新院,我接触了一批计算机领域的牛人,当然,其中也包括和我一起创业的团队。”
2010年加入盛大文学后,陈多次带领团队参加大数据挖掘竞赛。2014年,由ACM SIGIR(国际计算机学会信息检索分会)举办的CIKM Cup(一项国际数据挖掘竞赛)在中国大陆举行。
历时2个半月,陈最终带领团队在520支参赛队伍中夺得冠军。在随后举行的CIKM大会上,陈代表获胜团队介绍所使用的技术。这次会议也邀请到了 Google大神Jeff Dean、微软EVP陆奇博士、德国Max Planck Institue的Gerhard教授担任Keynote Speaker。
“竞赛过程中,我们团队不断优化数据模型和算法,使算法精度越来越高。”让陈引以为傲的是,他的团队搭建的预测系统在竞赛中排名世界第一。
◆ “达观数据”团队在比赛中获奖
2015年,盛大文学和腾讯文学合并为阅文集团,陈继续负责新公司的大数据服务。“创业团队的骨干一直都在一起,无论参加比赛也好,平时工作也好,大家积累起超越同事的情谊。”
“有一次参加数据挖掘比赛,零点宣布比赛成绩,我们是冠军。团队的同学从电脑前站起来,激动地相拥成一团,像是经历浴血奋战后打了一场胜仗。”后来,陈向团队提出创业,大家义无反顾地跟他一起。
确立5项服务
“其实大数据创业的想法,我酝酿了很多年。但创业是一件破釜沉舟的事情之前一直没有下定决心去做。”当时,早些时候从盛大走出来的朋友,在业内已经闯出了名气。
“从创新院走出来的团队创业都很成功,也给了我榜样。”2014年,许式伟创立的七牛云存储获千万美元融资,去年季昕华创立的UCloud获得近亿美元融资。
“去年企业服务、大数据应用的市场逐渐升温,我觉得这是很好的创业时机。”2015年夏天,陈离开阅文集团,创办“达观数据”。
陈和团队通过市场调研发现,虽然大数据概念早已被大众接受,但因存在技术门槛,国内市场上做数据挖掘服务的公司十分匮乏。
“大数据这些词,几年前已经泛滥了。但其描述的场景能否实现,关键在于如何挖掘以及应用数据。”而“达观数据”团队在百度、盛大、腾讯积累的数据挖掘经验(包括算法、应用场景技术)已经足够丰富。
此外陈还发现,对国内一般的互联网公司而言,大多数并不具备数据挖掘和应用的能力。随后陈根据团队的技术能力和市场调研结果将“达观数据”提供的企业服务方向确定下来:
1、个性化推荐系统。个性化推荐系统对用户的行为数据进行挖掘,然后推荐用户感兴趣的内容,提高用户的使用体验;
2、搜索引擎。为企业提供类似百度、Google一样完善的搜索功能,例如全文检索、首字母提示、自动纠错、查询意图识别等;
3、数据采集和分析功能。退出功能全面的数据采集和细致的统计分析系统;
4、数据预测功能。提供从宏观的整体数据趋势预测,到微观的用户行为预测;
5、文本处理功能。该功能可以自动提取关键词、打标签、文本内容检测、分类等。
11月,“达观数据”网站上线,采用SaaS形式为企业提供服务,企业调用“达观”的数据接口,就能使用这些功能。同月,达观数据完成1000万天使轮融资,真格基金领投,掌门科技、众米资本跟投,投资方表达了对“达观”团队发展潜力的看好。
服务第一家客户
12月, 上线不久的“达观数据”迎来第一家合作企业。
“它是一家互联网媒体。这家网站的创始人听了朋友对我们的介绍,主动联系希望使用我们的服务。”“达观数据”为这家网站提供了一整套的搜索引擎方案和个性化推荐系统服务,并且帮其完善数据采集和分析系统。
效果立竿见影。这套大数据系统上线后,网站的转化率提升了3倍。“他们非常高兴,我们自己也觉得挺欣慰的,在数据挖掘方面的积累让我们在第一家用户面前就大放光彩。”
◆ 团队小伙伴为企业服务中
上线3个月后,“达观数据”已经与15家企业展开合作。“其实对企业用户的需求拓展我们现在还在摸索中,将来会给更多企业提供越来越多有价值的服务。”
“我们面向这些企业的收费是阶梯性设置的,根据用户的数据规模、调用接口的数量和频次等指标来定价。”而“达观”服务过的企业,除了为它们提供已经开通使用的功能,还会根据所采集的反馈数据,持续优化系统。
“虽然‘达观’现在还是一个很小的公司,但我们的目标是远大的。希望未来大家讨论大数据的时候,都能想到‘达观’。我觉得这样我们就成功了。”
采访最后,陈再次回顾创业半年来的历程。“事实上,大数据应用的需求蛮多的,出发之前你会发现这个领域很多条路都能走。你不知道哪条路能走到终点。”陈一直很和缓的语气忽然加重了点,“但我们会沿着现在的路坚定走下去。”
本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流,内容版权归原作者所有,如涉作品、版权和其他问题请给「我们」留言处理。