用数据说话:一份不算总结的半年度总结

这半年,采集、建模、运维、运营、培训、新员工、实习生各类事情交杂在一起,每项工作其实都可以做得更好,但都落下了很多遗憾,现在做个简要总结,特分享于你。

这半年,采集、建模、运维、运营、培训、新员工、实习生各类事情交杂在一起,每项工作其实都可以做得更好,但都落下了很多遗憾,现在做个简要总结,特分享于你。

1、运营

提出了搭台唱戏的理念,启动了大数据的千人计划,这在以前的文章中都有所阐述,通过建模大赛、实操培训、大数据直通车、大数据微信群、一线互动等形式,对于拉动企业的大数据应用氛围起到一定作用。

对于传统企业,用大数据来驱动智慧运营,起步阶段靠的主要是管理层的推动,对此应有清醒的认识,后续的运营才见真功夫,想想有多少运动和工程当年是多么雄心壮志,轰轰烈烈。

在下半年的运营中,“用数据说话”是需要贯穿的原则,虽然为了推广大数据采用了很多手段,比如培训、宣传等,但每一项效果到底如何,经验判断还是太多了,宣传了一次,就说大概有用吧,其实平台的新增为零,这是要尽量避免的,手段多、投入大并不代表有用,还是需要通过闭环跟踪去逐步改进,用数据说话短短五个字,要掌握精髓还是很难。

最近有个体会,搞数据的以为自己天然就是用数据说话的,现在想来真是个悖论,报表、取数、挖掘人员做了一生的数据,大多却是为了让别人用数据说话,真的将这个原则用在自己身上,又有几个事是用数据说话的?

对于蹒跚起步的运营团队,KPI就是灯塔,用数据来驱动运营要成为团队做事的原则,随着使用人员规模的扩大,要更关注平台和数据的使用体验,这是全新的挑战,客户的抱怨和投诉都应该视为改进的机会。

2、采集

有三个收获,一个是DPI内容解析起步了,团队开始体系化的梳理视频、商品等知识库,去构建真正能投入实用的客户偏好标签,其实3年前就开始想做了,直到现在才算真正踏出了一步,为什么拖这么久?因为从数据源、人员、能力各个方面讲不具备条件,即使是现在,https的影响,无尽的内容,DPI解析的限制,都是摆在面前的挑战。

第二是企业的爬虫平台起来了,这个非常有意义,没有爬虫的配合,DPI的价值就会降低一半。

第三就是采集运维团队步入正轨,流水线化的采集配置流程渐入佳境、2000个接口,近2万调度流程的自动告警能力,稳步推进的数据质量自动稽核体系(PC+手机)。

留下的一个遗憾是虽然制定了采集规范,但在现实的推进中总是需要做些妥协,有时候妥协变成了放任,这就是自己的问题了,需要明确一些流程,坚持企业级的一些原则。

另一个遗憾是虽然接入了更多的数据,但对于很多跨域的数据理解还很不够,空守着数据却没法发力,这是下半年特别需要改进的,当然数据的理解是个长期的过程,往往跟短期的事务工作相冲突,这个度不好把握,储备能力对于任何一个团队都是现实的挑战。

3、建模

企业的转型造就了大数据建模成长最好的环境,从数据,技术,平台,资源,合作各个方面,公司的条件可以说是无与伦比,但机会还是留给积极主动的人。

有二个收获,一个是坚守住了原则,基础模型和融合模型牢牢的掌握在了团队手里,二是在反欺诈,信用分、校园模型、视频推荐、精准位置、精准广告、政企挖潜等方面都出击了,标签也达到了一个新的阶段,算是摸到了互联网推荐、搜索的门槛。

组建建模团队对于任何一个传统企业来讲都是很大的挑战,性价比备受质疑,很多企业的建模人员大多变成了报表取数人员,因为报表取数是看得见摸得着的,但建模的价值,很难说清楚。

建模团队在传统企业能生存下来要感谢时代、企业赋予的机会,因此得倍加珍惜,经常提醒团队,“建模虽然于个人成长价值很大,但能否给企业带来产出,心里要有杆秤。”

有三个遗憾,一是团队很年轻,还没有出现专家级的数据科学家,底子还是比较薄的,二是对外真刀实枪的变现建模还要加强,无论从速度还是精度看都不够,三是深度学习,Tensorflow一直无暇顾及,主要受限于人力,最近找了一个切入的场景,希望有所起色。

4、运维

大数据的运维虽然没有CRM这类系统的保障要求高,但加班加点是常事,半年的稳定靠的还是新人的年轻和血性,数据要么不出事,出事了也要命。

随着大数据平台使用的人越来越多,生产性要求也越来越高,当前很多地方由于缺乏自动化只能进行人肉保障,比如调度失败后的规则重试,下半年需要系统化的去梳理运维的各个环节,建立起新的运维指标体系和保障体系,对外需要有明确的承诺,现在运维人力上的投入跟建模差的很远,应该也要补充了。

5、管理

主要是数据管理平台推进到了一线,大家基本上接受了这种可视化操作数据的方式,同时数据字典、调度流程、安全控制、数据挖掘等能力都加载在了上面,标签库和营销平台的使用率都在同步提升,初步形成了面向用户的真正PaaS, 缩短了与一线距离。

但问题还是很多,一个是平台体验,包括与云管理平台的打通、数据直接发布到标签库的能力、数据挖掘的无缝集成能力、由前台反应出来的后台性能问题等等,另一个是模型创新,当前在标签库上积淀的东西还是有限,要让全省的模型经验能够常态化分享,还有很多工作要做,搭台唱戏模式起来后,最终拼的就是PaaS,也就是中台能力。

6、培训

上半年编撰了17门课程,累计大数据现场培训超过1000人次了,培训投入的代价不可谓不大,但如何进一步提升培训效果仍是一个挑战,比如经常是培训那个月用了,下个月又不用了,说明存在很多问题。

下半年要用产品化的思维来运营培训,一方面需要将所有的课件整理成一组套件,在大数据平台的各类入口提供引导,要让帮助出现在合适的位置和时间,运营总是低估了培训的难度,高估了客户的耐心,比如给目标用户发了一个下载课件的链接就算完成了培训课件的发布,如果站在客户的角度考虑问题,就要想到有多少人会真正去打开一个别人的链接邮件,以后找不到邮件怎么办?另一方面就是以大赛为契机,团结一切可团结的力量做大培训规模,包括一线的转陪、跨域的培训整合等。

7、新员工和实习生

今年由于培训课程体系起来了,可以让新员工和实习生自己学习课件了,这省了很多培训的精力,实习生达到了创纪录的17个,还是能按部就班的安排课题,希望有更多的新人能加入团队,

这次要给实习生做些大数据介绍,我列了一些大数据成长的建议,感觉也是纸上谈兵,对于新人的培养缺乏节奏感,在每个导师都很忙的情况下,如何让新人一步步上台阶的确是个考验,不是说句新人多加加班的话就能解决的,下半年要把这个事情想清楚,这关系着团队的未来。

8、自我修养

读了一些书,但当前积压在案头的新书很高了,后面一定要努力,另外选择的书大多是跟专业相关的,下半年尝试着更人文一点,一些不得体的做法往往是眼界所限,修炼不够,还是需要突破自己。

订了得到很多专栏,的确有了收获,但如果要真的长见识,还是需要系统的看经典书籍,听了每天一本书,20万字缩减成20分钟后,很多索然无趣,各位大咖也不是神仙,在后面再难得到闪光点,而能选择的书是整个世界。

读书也从来不会很轻松,就好比深度学习要训练参数那样,想想耗了多少GPU,不太花脑力的阅读显然也不能奢望有更好的产出,同时要选对书,就好比选择超参数那么重要。

最后,要更多的陪伴孩子,今天跟儿子外面闲庭漫步聊得很开心,鼓励一下自己。

本文为专栏文章,来自:与数据同行,内容观点不代表本站立场,如若转载请联系专栏作者,本文链接:https://www.afenxi.com/47401.html 。

(2)
与数据同行的头像与数据同行专栏
上一篇 2017-08-07 04:00
下一篇 2017-08-13 11:00

相关文章

关注我们
关注我们
分享本页
返回顶部