对于任何一个在数据领域摸爬滚打的人来讲,取数往往是其数据生涯的开始,通过取数我们了解了公司的业务、系统和数据,没有经历过取数肯定是不完整的数据人生,这也是企业很多数据分析师,数据挖掘师职业生涯的起点。
但你会发现,企业内有人通过取数升级成数据分析师、数据挖掘师,亦或投奔业务,而很多人则一直在取数,捣腾着那一分三亩的数据,很勤奋但没有进步,为什么?
同样是取数的新人,往往3个月后就会体现出巨大的差距,这在企业内见得很多了,为什么?
自己做过长达4年的取数,教训和经验很多,随着科室新人增多,建模的建模,变现的变现,取数则是其干成事的一门基本功。
笔者一直想对于自己的取数得失做个总结,看看是否于团队的新人有益,道理早点知道,受益终生, 直到最近读了《刻意练习》这本书,才让我找到了答案,为什么同样是取数的人,差异是如此巨大。
取数虽然技术门槛不高,但要取好数就如任何一门职业一样,非常不易,新人的取数如果养成刻意练习的习惯,则可以超过99%的人,当然其实任何职业都一样。
让我们看看一个新人到达单位后学习取数的一般方式:
你首先会进入一个数据团队,然后团长会给你安排一位同事做你的导师,你的导师首先会让你准备一些取数的装备,因此,你申请了系统账号和取数平台账号,被授权了数据访问权限,然后你具备了取数的环境。
你决心开始学习,但你不知道取数的第一件事到底是什么,因此,你得从导师那里了解到取数需要具备哪些基本技能,比如SQL,如果你SQL不会,你还得自学一下,假如不同平台SQL写法不同,你还得从导师那里拿到一些样本专项学习,取数的工具如果不会用,你还得再补习一下,或者导师可能手把手教你一遍。
然后,导师给了你很多以前的取数需求和代码,你会去理解需求中的业务概念,这些业务概念与数据是怎么个对应关系,从代码中你知道了如何从取数平台中获取这些数据,当然还涉及一系列导入导出的工作,最后,你终于知道如何端到端的去完成一个取数。
你似乎掌握了基本的取数技能了,但你发现,你对于一个新取数需求仍然完全无从知道如何下手,然后,你一遍一遍的进行实战演练,团队也会给你一些新的需求让你尝试做做看,随着练习的深入,你开始对于SQL的写法很熟悉了,比如你知道了创建一张新表比更新数据表效率似乎更高一点,你对于某类业务的取数似乎形成了一定的解决套路,比如假如取数涉及费用和用户,只需要从用户宽表去取就可以了,随着积累的增多,你逐步驾轻就熟了,你已经可以独立完成团队给你分派的取数任务了,那也就是说,你已经在传统意义上“学会了”取数。
随着取数阅历的增多,你的所有取数动作都是自动完成了,你的表现也逐步被业务人员接受,不需要太多的思考,到这个时候,即使你对自己的取数水平并不是彻底满意,但你的进步是实实在在的,你已经掌握了容易的技能。
的确,一个努力的取数新人,在6个月到1年时间都能达到这个水平。
但你很快便会发现,你依然有一些弱点,不论你多么经常的取数,这些弱点总是暴露出来,比如突然要取一个从来没见过的指标,你从现有的表中根本没见过这个指标,然后你还得去找团长,团长告诉你这个指标现有的表中没有,得找到这个表的源头去取,然而你根本不知道源头的表在哪里,那个对你来说是黑箱子,团长只得手把手教你找到了那张表。
这次取数比以前长很多,颇费周折,虽然你会感到一点挫折,但不管怎样,由于问题解决了,而且这并不经常发生,而且你永远不知道业务人员什么时候再有类似的需求,因此,你没有必要形成针对此类问题解决的套路,当3个月以后再面对这种问题,你总是以前一种的方式去应对。
类似的问题很多,人家觉得你取数慢,你不会去想怎么提升,大多归因于时间紧、系统慢呗,业务部门有抱怨,你不会思考自己的问题,大多归因于人家不讲理呗,数据出得晚了,也就抱怨一下仓库太垃圾,维护不给力,如此总总。
这个时候,你被其他的人拉开了差距,团长也不自觉的调低了对你的期待值,而你自己却不知道。
在我们学习任何一项技能时,我们全都遵循很大程度上相同的模式,首先,一般性地了解我们想做些什么,从导师、书籍或网站上获得一些指导,然后开始练习,直到我们达到可接受的水平,接下来,让这种技能变成自动的、自然而然的,这种方式并没有错,我们工作或生活中所做的事情,很多只需要我们达到中等水平便可以了。
但在这里,你要理解一件非常重要的事情,一旦你已经达到了这种令你满意的技能水平,而且能做到自然而然地表现出你的水平,你就已经不再进步了,人们通常错误地理解这种现象,因为他们自以为,这种形式化的练习,如果不停地做下去,自己一定能够更擅长、也许进步较为缓慢,但最终还是会更出色。
人们认为,开了20多年车的老司机,一定会比只开了5年车的司机更擅长开车,教了20多年书的老师,一定会比只教了5年书的老师能力更强。
但是,现实并不是这样的,研究表明,一般而言,一旦某个人的表现达到了可接受的水平,并且可以做自动化,那么,再多练习几年,也不会有进步,甚至如果没有特意提高,这些自动化能力会缓慢的退化。
恰好最近笔者去理了一次发,感触颇深。
因为小区的理发店要等很长时间,因此笔者破天荒的到了一家很贵但不需要等待的理发店,理了史上最贵的一次头,61元,而一般小区只要25元,给我理发的是20岁出头的小伙子,以前小区的是40-50岁的大叔了,但这次的确理的很好,笔者脸比较圆,头发也不多,因此小伙子通过适当改变我的发型让我显得不那么胖,而且头型表面均匀而自然,不像小区理的那样,有点杂草丛生的样子。
然后我问了老板情况,他说他们这里的都是专业的理发师,还分了很多档次,有41,61,128,237的,而且这些理发师都非常年轻。
取数也是这样,作为一项基本的生产任务,大多必然是枯燥和技术含量不高的,有太多的取数人员沉溺其中,做着重复的工作而没有进步,有人会说这是公司的任务,多枯燥也得完成,但笔者想谈的是取数进步的阶梯,取数能否进步其实跟工种没有关系,只跟自己的练习方式有关,即使抛开自己的成长因素,更强大的取数能力对于公司也是百利而无一害。
那么如何提升取数能力从而成为大师呢?
《刻意练习》这本书提到刻意练习是我们知道的最有效和最强大的练习形式,对于刻意练习原则的运用,是为任何行业或领域策划和设计训练方法的最佳方式,刻意练习大致包含以下一些特征,这里笔者结合取数也谈一谈。
1、刻意练习包含得到良好定义的特定目标
刻意练习包含得到良好定义的特定目标,通常还包括目标表现的某些方面;它并非指向某些模糊的总体改进。一旦设定了总体目标,导师或教练将制订一个计划,以便实现一系列微小的改变,最后将这些改变累积起来,构成之前期望的更大的变化,改进目标表现的某些方面,使得从业者能够看到他的表现已经通过练习得到了提高。
我们假想音乐学生如果确定了类似下面这样的练习目标,可能会比他漫无目的的练习要成功的多:“连续三次,不犯任何错误,以适当的速度弹奏完曲子。”如果不制定这样一个目标,就没有办法判断练习是不是成功了。
你要练习取数的速度,首先要练习业务理解能力,你可以把所有的历史取数需求做个分析,将所有指标分门别类,针对每类指标,归纳总结从哪类表中可以快速的获取,你可以一天设置一个业务目标,攻克一类业务的取数方式。
笔者以前取数从市场取到财务再到客服再到政企,花了巨大的代价在实践中去熟悉每类业务的取数套路,自己已经觉得不错了,但如果当时遵循上述目标原则,取数的速度肯定会更快。
2、刻意练习发生在人们的舒适区之外
刻意练习要求持续不断地尝试那些刚好超出他当前能力范围的事物。因此,它需要人们付出近乎最大限度的努力,一般来讲,这并不令人心情愉快。
比如原来你取数习惯于串行跑脚本,现在要提速,因此你得改变原来写代码的方式,换成并行的逻辑,换成并行意味着可能这次取数要花更多的时间和代价,你本能是不愿意的。
比如你负责为市场部取数,如果驾轻就熟了,就有必要为自己制造点麻烦,可以申请去为政企部、财务部、客服部等更多的部门去服务,在一个全新的陌生领域可以更好的提升自己的技能。
听一些互联网公司的取数人员讲,每天只能倒腾自己那一块数据,取得都烦了,感觉没意思,没意思就意味着没有挑战,意味着大脑其实很舒服,这对于数据人员的职业生涯是个危险的信号。
3、刻意练习是有意而为的
也就是说,它需要人们完全的关注和有意识的行动,简单地遵照导师或教练的指示去做,还不够,学生必须紧跟他的练习的特定目标,以便能做出适当的调整,控制练习。
很多新人取数有个问题,就是太乖了,导师说一句,他动一下,完全不敢越雷池半步,这个时候,导师的瓶颈就是你的瓶颈,这样取数水平很难青出于蓝而胜于蓝。
记得以前笔者刚进公司的时候,取数是基于PLDEV这个软件的,经常代码贴上去就直接跑了,但后来发现作业多了管理就混乱了,而且一步小心就关掉了页面,规模化效率怎么也提不上去,笔者那时就提出搞一个作业管理工具,能够7*24不间断的跑,但这类超越现状的刻意提升的工作还是少了。
4、刻意练习包含反馈以及为应对那些反馈而进行调整的努力
在练习过程的早期,大量的反馈来自导师或教练,他们将监测学生的进步、指出存在的问题,并且提供解决这些问题的方法。随着时间的推移,学生必须学会自己监测自己、自己发现错误,并做出相应调整。
大多企业对于新人是没有那么好的即时反馈机制的,一般取数新人在能端到端完成一个取数后,企业安排的导师就很少关注新人的成长了,因为自己也是这么过来的。
这是有问题的,我们似乎过于相信新人的自我更新能力了,有时候新人甚至不知道自己哪里不知道,比如新人过于痴迷于数据仓库模型,以为这就是数据的全部,却全然不知道源系统数据的学习更为重要,解决取数问题光知道what,how是不够的,还需要知道why,这就需要导师给予新人更多的,及时的反馈,让取数新人发日报并且给予及时反馈是必须的,但即使这一点也很难做到。
5、刻意练习既产生有效的心理表征,又依靠有效的心理表征
首先要理解下心理表征是什么,因为这是刻意练习的核心概念,心理表征是一种与我们大脑正在思考的某个物体、某个观点、某些信息或者其他任何事物相对应的心理结构,或具体或抽象。
这里举个例子你就明白了。
很多国际象棋大师具备下盲棋的能力,在对弈中,对国际象棋大师来讲,对手每下出一步棋,只有短短几秒钟的时间来研究棋盘,因此,他们将准确地记住大多数棋子在棋盘上的位置,而且能够近乎完美地重新确定棋盘上最重要的区域,相反,刚刚开始下国际象棋的人,只能记住几个棋子的位置,没有能力去重新配备棋盘上的棋子,难道国际象棋大师的记忆力更好?
实验表明,国际象棋大师对于有套路的棋盘,经过5分钟的研究,能够记住大约2/3棋子的位置,但新手却只能记住大约4个棋子,而当他们全都看到随意摆放棋子的棋盘时,新手的表现某种程度上还是差一些,只能准确说出2个棋子的位置,这是意料之中的事情。不过,令人惊讶的是,无论是水平中等的棋手还是优秀的大师,在记住棋盘上随便乱摆的棋子的位置方面,并不比新手表现得优秀。
任何一位真心想提高国际象棋水平的人,通常会花无数个小时的时间来研究大师下过的棋局,也就是我们说的“打谱”。深入分析棋子的位置,预测下一步招法,如果猜错了,回头再想一想自己到底漏算了什么,多年的训练,使得国际象棋棋手只需看一眼,就能辨别出棋子的规律,不仅是它们的位置,而且包括它们之间的相互关系。
国际象棋大师处理和解释棋子位置的方式,就是心理表征的一个例子。这是他们“看到”棋盘的方式,而且,新手与大师相比,尽管看到的是同一个棋盘,理解却全然不同。当他们在心理上观察棋盘上的局势时,问他们看到了什么,大师不会说他们看到的棋盘上的实际棋子,不会只按照某种对棋子位置进行“照相式记忆”的方式来理解棋盘上的局势,这些是“低级”的表征,相反,他们的描述模糊得多,通常会说出一些“攻击线路”以及“运子”之类的术语,这种表征的关键在于,它们使得棋手能将棋盘上棋子的位置进行编码,而且,编码方式比只是简单地记住棋子到底位于哪个方格之中有效得多。
又如开车时必须考虑诸多不同的因素,如速度和动量,其他车辆的位置和速度,路况和能见度,脚是必须放在油门踏板上还是刹车踏板上,用多大的力度踩踏板,以及打方向盘的时候该打多猛等等,对于任何较为复杂的活动,我们都得在脑海中记住更多的信息,但它们超出了短时记忆的极限,因此,我们总是在自己甚至还不知道的情况下,就创建了这样那样的心理表征。事实上,没有心理表征,我们连走路(太多的肌肉运动需要协调)、说话(同样要协调肌肉的运动,再加上要理解所说的话的含义)都做不到,根本无法生活下去。因此,每个人都拥有并使用心理表征。
几乎在每一个行业或领域,杰出表现的标志是能在一系列事物中找出规律,这些事物,在无法创建高效心理表征的人们看来,可能是随机或令人困惑的,换句话讲,杰出人物能够看到“一片森林”,而其他所有人,却只看见“一棵树”。
心理表征的形成依赖于三个F,专注(focus)、反馈(feedback)以及纠正(fix it)。将技能分解成一些组成部分,以便反复地练习,并且有效地分析、确定你的不足之处,然后想出办法来解决它们。
取数技能可以分解成业务理解、数据理解、系统理解、业务与数据映射、人际沟通、代码编写、工具使用、输入输出等组成部分,只有针对每个环节进行反复的练习及有效分析,针对不足之处进行专项提升,才能建立起强大的心理表征能力。
接到一个取数需求,新人看到的是一堆文字描述,取数大师看到的是从业务术语表达出来的业务种类,每个业务种类对应的数据类别体系,每个数据类别体系能支撑的指标体系,不仅如此,大师还能一下看出这个需求有哪个点是某个数据类别体系不能单独支撑的,必须基于数据类别的交叉关联才能支撑,甚至更深一层,这个需求不是由当前的数据类别体系支撑的,必须映射到源系统的数据类别,层层深入。
在几秒中之内,取数大师就能判别这个需求能否支撑,有哪个点是存在歧义的,需要业务人员进一步澄清的,这个需求的支撑的难度如何,大概要花多少时间等等,取数大师甚至能够猜到业务人员的真实意图是什么,从而可以为业务人员提出更好的取数建议。
胸有成竹这句成语就是强大心理表征能力的体现,提高水平与改进心理表征是相辅相成的,两者不可偏废,随着水平的提升,表征也变得更加详尽和有效,反过来使得人们可能实现更大程度的改进。
6、刻意练习对于大脑的物理改变有科学的依据
如果你是一名健身爱好者,通过反复练习,可以让你的身体带来显而易见的变化,但如果你要挑战自己的心理能力,比如精通取数,要观察你的大脑因这些挑战而发生的改变并不容易,因为它会逐步地适应你强加给它的日益提高的要求,艰苦地训练一天后,你的大脑皮层并不会酸痛,你的脑袋也不会真的变大,不必由于以前的帽子现在戴不下了,而出去重新买顶新帽子,你不用在额头上训练出六块肌肉来。由于大脑中的任何变化你无法亲眼看见,所以你很容易以为,这些训练真的不会给你带来太大的变化。
不过,这是错误的。越来越多的证据表明,大脑的结构与运行都会为了应对各种不同的心理训练而改变,而且,很大程度上像你的肌肉和心血管系统响应体育锻炼那样,你的大脑会由于刻意反复的练习而发生物理的改变,你的大脑会改变某些神经元的用途,以帮助完成那件任务,大脑走出舒适区后,则更容易改变大脑结构。
这为刻意练习带来大脑改变提供了科学上的解释,但令笔者感到意外的是,所谓的天生才华,比如莫扎特传奇、自闭症奇才等,都是刻意练习带来的结果,有大量的研究表明了这一点,没有所谓的基因优势,即使有,也仅仅是开始之初有了兴趣而已。
7、刻意练习的限制
但刻意练习要发挥出极致,却也有其特定要求,取数要采取刻意练习的方法提升水平难度不小。
有目的的刻意练习意味着需要能方便的区分好和差,这对于能直接竞争比拼好坏的行业或领域比较方便,包括音乐表演、芭蕾舞蹈、国际象棋以及体育竞技等,但针对企业经理、教师、工程师、数据分析师、咨询师等等,并没有成形的方法套路,能够有客观的标准来评价卓越的绩效。
比如取数其实是数据人员的职业中间状态,各行业对于取数人员的定位基本是螺丝钉的角色,取数大师最终都走向了数据挖掘师、数据分析师等岗位,谁都没有留下取数这类小专业刻意练习需要掌握的套路和知识,比如市面上从来没有关于取数技巧的书,而诸如钢琴、滑冰、象棋等领域,受益于数十年甚至数据百年稳定进步的行业或领域,每一代人都将他们从上一代人那里学到的经验和技能传承下来, 他们的训练方法令人惊讶的一致。
但刻意练习作为一种行之有效的学习方法论,你依然可以运用刻意练习的原则,让自己成为企业中的取数大师,而且一旦掌握了刻意练习的方法,将使自己的人生充满各种可能。
本文为专栏文章,来自:与数据同行,内容观点不代表本站立场,如若转载请联系专栏作者,本文链接:https://www.afenxi.com/50119.html 。