案例分享：百度人力资源大数据实践

案例分享 | 百度人力资源大数据实践

本文整理自百度人力资源系统与运营共享平台高级经理王崇良先生于“2016人力资源技术与服务大会”上的主题演讲。

首先来讲一个小故事，扁鹊治病：一天魏文王问扁鹊：“你家兄弟三人谁医道更高深一点？”扁鹊说：“我大哥最好，二哥次之，我最差。”魏文王又问：“那为什么大家都知道你最厉害呢？”扁鹊答曰：“我大哥看病的时候，通常病还没发起，他就能看到病因并在发病前就治好了，只有家里人清楚；二哥看病时病刚发作，开个药方吃个药、打个针就好了，所以本村人才了解；而我看病的时候，通常已经到了晚期，要大动干戈，动手术，动静最大，所以大家以为我最厉害。”这个故事告诉我们在公司成本控制与效益上，事后控制不如事中控制，事中控制不如事前预防，即所谓防患于未然。当然更重要的是象扁鹊大哥一样事前要能洞察，防微杜渐，提前预警预测，避免走弯路、错路，为业务增效。

还有一个故事是庄子识人九征，企业管理中也广泛应用，庄子识人有9个场景：看忠诚、看教养、看能力、看智谋、看信誉、看仁义、看节操、看仪态、看为人，也涵盖了人力资源的选用预留之道。这9个场景用大数据的思维方式的话，每个场景都有构建自己的子场景及子空间，然后提取其特征，进行复杂的行为建模，找出其中关联，最后得出识人的结果。

案例分享 | 百度人力资源大数据实践

大数据时代的思维变革

大数据近年我们谈得很多，图中显示的是每60秒能产生的一些数据。对于人力资源来讲，大部分企业人力资源领域产生的数据基本上还是在GB这个级别，可能有几十个到几百GB，BAT等一些大企业平时也比较重视数据，也有技术收集数据，可能相对高一些，达TB级别。业界的共识，PB这个级别基本上是大数据的临界点，也就是说数据量达到PB以后，才能真正去谈大数据。那是不是说我们人力资源就不能谈大数据了？我们可以利用大数据的思维与方法以及技术，去研究与探索人力资源管理，从而为企业人才方面的决策提供高含金量的依据。

案例分享 | 百度人力资源大数据实践

大数据有着4V的特征，Volume数据量要大；Variety数据类型多；Velocity高实时性；另外Value价值要高。除此之外还要全，还要是活的数据。比如简历，可能找到工作了也许就不更新了，有什么好的办法让他持续更新、变成活的简历数据呢？

大数据时代的新思维：过去我们做数据都是采样，而大数据，实际上不是采样，而是全部数据，必须用全部数据来做这样的事情。另外，我们过去采样的时候要求个体数据要很精确，但是大数据允许不精确，它可以接受混杂性，它要求的是有效性。还有一个特点，过去做数据分析是事先提出一个主观因果假设，然后收集数据、分析来验证假设，这是因果关系，但大数据讲究的是相关关系。

思维模式转变：大数据的处理和技术发展到今天，类似一个“盲人摸象”的阶段。可能摸到的是“腿”、“鼻子”等部分，虽然正确但不是全貌，随着大数据技术的不断进步和越来越多的活而完整的数据源，探索到的东西也将无限逼近事实与真相，也越能获得更深邃的智慧与洞察。

案例分享 | 百度人力资源大数据实践

百度人力资源大数据应用从业务的角度来讲模型是如何的呢，分成三块：数据的收集与清理、数据建模与分析、报告与决策建议。首先要在信息化流程建设过程中埋点收集数据，对我们来讲，无非是“入离升降调，选用育留辞”这些核心的系统和外围的系统，除此之外可能也有很多非结构化的数据。我们平时说的Core HR加“入离升降调”等所有这些系统产生的数据大多都是关系型数据，这些数据在大数据范畴里可能占比只有30%—40%，像我们的面试评价、评论、论坛吐槽、360度的评估、行为数据、附件、图片等等非结构化的数据可能要占到60%—70%的水平。关于数据分析，我们也做了很多的指标，有人才管理、运营管理、组织效能、文化活力、舆情分析等，做了相应的指标体系建设和相应的建模，在这之上完成了很多应用比如BIEE、个人全景、用户画像等，为管理层的人才决策提供参考与建议。

案例分享 | 百度人力资源大数据实践

今天我重点讲三部分内容，一是我们系统信息化的建设路径；二是部分业务场景，最后会讲我们大数据平台“才报”的应用实践。

百度的人力资源信息化建设路径

信息化的建设通常都是从无到有，从残缺到完整，从完整到全面，从优秀到卓越这样的一个发展过程。我们也经历了三个时代，1.0时代可以算作在2010年之前，主要是一个Payroll的系统，当然同期我们也有很多几十个其他系统，因为背后是不同的业务体系，系统之间也是相对独立的，包括我们的分公司。2.0时代即2012年的时候我们做了全面的升级改造，在内部称为eHR年；如果1.0时代的系统是个四合院的话，2.0时代我们在四合院的基础上对整个系统的流程与数据重新做了梳理、提炼、沉淀，重新打造了Core HR的主数据，就像建房子重新打地基、打隔断、拉水电，建了十层楼。除了整个Core HR之外，我们也做了入职系统、升降调转这样的系统，同时也把分公司，并购公司的规则也纳入进来，所以整个系统是面对不同的文化、不同的业务、不同的规则去纳入整个体系。2012年，我们建设的比较快，多个团队多模块同时进行，敏捷开发，快速迭代，用了一年时间升级到2.0时代。

2013年的时候，我们又开始对系统做了精耕细作。除了全生命周期的人才管理之外，又在另外三个方向上做了升级。一是文化方面，我们并购的一些公司在海外做了扩张，对这些组织文化做了很多新的支撑；除此之外在BI层面，我们开始做了大数据的探索。数据层面，我们做了BIEE仪表盘，个人全景这块也做了很多打造。同时在服务平台上，我们开始分别建设HR、行政、IT、财务的共享服务，这是四位一体协同创新的项目。2012年的时候系统建设较快，拔出萝卜带出泥，2013年又把地基打得更牢了一些，对整个系统做了精耕细作。这样不光系统之间是互联互通的，在数据层面也是端到端的流转，是整个系统工程。

2014年底时我们对未来做了一个全面的规划，概括起来是四化：智能化、数据化、社交化、移动化，开始全面打造一个智慧型HR（Smart HR）助力业务发展。2015年到2016年，我们一直在致力于这个规划。在移动化方面我们做了便捷化的办公、碎片化的学习、多彩化的生活，相应的产品有：度学堂、度生活、移动办公。社交化层面我们也做了一些探索，主要解决三个问题：团队协作、分享互动、文化融合。我们有“合伙人”、“摆渡人”、各种论坛和游戏化平台等。我今天讲的主题主要是数据化这一块，我们怎样去明事实，察问题，拉预警，报预测。

案例分享 | 百度人力资源大数据实践

举个例子，度生活的平台，这是一个大的概念，凡是和员工服务相关的，生活、娱乐，好玩有趣的东西都纳到平台上去，除此之外，还把HR服务相关的DUHR纳到移动端，便于支持员工服务。度学堂帮助实现移动的、碎片化的随时随地学习，新员工来了怎么给他一系列的培训，除了线下还有线上，我们有个职业化之旅的项目可以通过90天的学习与训练全线打造出一个职业化的战士，分为蜜月期、迷茫期、挑战期、崛起期，每个期都由相应的必修课与选修课。我们也在探索文化、学习、社交、绩效、激励，人才成长，这是相加的关系和相乘的关系，背后的逻辑实际上需要我们整个数据的支撑。

归纳总结我们系统的三个时代，1.0时代工资发放是重点，2.0时代我们打造的是全生命周期的管理和多维分析报表，3.0时代做的是大数据如何助力业务，为战略保驾护航。可以看到整个侧重点，1.0时代注重结果，2.0时代注重过程，3.0时代注重的更多是价值输出；整个HR的状态是从被动到主动，HR的地位也逐步提升，反映到为业务带来的价值也在开始无限增大。

案例分享 | 百度人力资源大数据实践

业务场景

百度文化价值观是简单可依赖，它有一系列的解读。“简单”就是简单为人，简单处事，管理简单，产品简单，贯穿我们的为人处世、工作和产品设计上。“可依赖”就是自己做值得信赖的人，也信赖同事，从可信到可依赖。我们的文化价值观会固化到系统中，也会固化到设计上，平时的绩效考核、试用期考核，每年年度文化价值观的考核也会在百度30多条论语中挑选10+条纳入考核，也会把年度考核评价纳到数据分析的范畴里。

另外一个场景，百度人才成长机制，百度的人才发展观一共有4句话：招最好的人，给最大的空间，看最后的结果，让优秀人才脱颖而出。“招最好的人”有个定义，要认同百度“简单可依赖”的文化，要胜任自己的工作，具备优秀的学习能力。怎样在复杂的形势面前，去快速学习，并拿出自己的方案决策，这就需要优秀的人才，有分析事物、学习事物，应对复杂事物的能力。第2句“给最大的空间”，任何行业的人才都需要很大的空间去成长，除了成长环境，还要有实实在在的项目来支撑。“看最后的结果”，选才用才标准我们都有，怎样“让优秀人才脱颖而出”，我们有很多项目支撑，Up or out，三年升两级，有绩优，有淘汰，业务和文化奖优惩劣。百度的人才发展观背后都可以分解成若干个项目，每个项目都有相关系统支撑去做，数据也收集起来。

才报应用实践

下面重点来讲百度的人力资源大数据平台–才报的应用实践。刚才我们从业务的角度给出了大数据应用的模型，那么从技术的角度来看的话，百度的人力资源大数据平台–“才报”的逻辑架构是什么呢？实际上，底层是系统层，也可以看作数据收集层，刚才谈到的百度人才发展观四句话背后都有很多项目，都会落地到系统上，除了ERP之外，有入离升降调、选用育留辞若干个子系统去支撑，还有内网各种论坛，还有业务系统去打通，这些系统都埋有数据收集点，系统互联、数据互通，这是基础。再往上就是数据层，我们有大数据Spark、Hadoop然后去存储这些复杂的数据，图片、评论等非结构化的数据，除此之外，通过ETL分时数据提取服务、OGG实时数据同步服务，背后会有数据机制去清理与加工处理。再往上一层是分析层，数据初步加工之后，经过梳理归纳到分析层，我们建有自己的指标体系：人才管理、运营管理、组织效能、文化活力、舆情分析等200+关键指标库。再往上会做一些场景分析，各种分析模型，自定义分析等。最上面就是我们一站式的大数据服务平台——展示层，其实老板看到的，HR用到的就是最上面的这些东西，包括用户画像、自助服务等都是一站式的平台。

我们从四个层面去做：基础报表，是我们一直在做的，我们的BI分析每年都会升级一个版本；除此之外，我们在做主题分析，自定义分析，背后各种模型怎么输出；预警预测从2014年下半年开始到现在也一直在做探索，往前推进迭代；最后是平台服务。

步骤是我们对5个层面的时间过程进行梳理。首先对内、外部数据进行整合，建立HR主题大数据仓库；同时对数据进行人才标准量化；第三是管理实践如何场景化，这一块从去年开始一直想在推，我们的HR都来自大企业，在百度也都有很多丰富的实践，这些实践如何在系统埋点，如何去落地、沉淀都会对未来大数据研究有丰富的助益，对业务未来的预测提供很大的帮助；还有就是深入整合业务属性；最后流程集成一站式数据分析服务，大数据有助于完善我们的流程，是一个螺旋循环上升迭代的过程。

案例分享 | 百度人力资源大数据实践

“才报”价值实际上服务于4类角色，一是对高管，二是对经理，三是员工，最后HR自己。对高管我们打造一图在手，人才信息尽在掌握；一表在手，数据分析提供决策建议；预警人力管理的红绿灯。对经理来讲，他们在业务一线不可能投入太多精力关注人员的日常管理，我们的系统最好能一键到位提供及时的服务，聚焦业务，流程、审批化繁为简，操作简便，提升用户体验。对员工来讲，工作、学习、文化、生活四位一体，把工作做好，随时随地碎片化、游戏化学习，得到周到、温馨、便捷、有效的共享服务。对HR自己也有要求，建立统一的工具知识库，打造有战斗力，不断创新的HR团队。另外还有更高的要求，我们怎么样提供更多的价值输出？从价值的角度，给高管一些预测性的决策建议；给经理场景化的智能操作、让经理更聚焦在业务一线战斗；对员工小温馨大体验；对HR自己要学会赋能与引领。

案例分享 | 百度人力资源大数据实践

“才报”平台的服务对象就是：HR + M层。对团队、组织来讲，有三棵树，组织树、汇报关系树、产品树。无论是横看还是纵看，重要的是以业务为导向。产品树就是在老板关注的业务，产品方向上，怎么去打通，让他了解业务、产品的发力点和竞争对手在哪儿。人才层面，有个人全景、攻城狮画像，通过标签化的形式重新定义员工客观面貌，同时还有两张表去展示绩优、淘汰。业务层面我们也会和财务、产品等对接应用场景，同时结合行业内外的数据，给内部HR提供参考，更重要的是预警预测。

如何做？就是对原始数据进行净化，然后形成报表，到建模后定制报表，这些都是陈述传统意义上过去发生了什么；然后进行描述，同时有红绿灯、仪表盘等更直观的展示；探索未来可能发生什么，这是我们一直在强调的，我们把昨天的数据丢到机器里进行自主学习，把过去的经验和案例扔到模型里面，让系统找出相关的关联关系，自主去学习，利用过去在系统里分析判断，然后拿今天的数据来校验、调整、优化模型，从而更精确地预测明天可能发生的事情，及时采取相关行动，占得先机。

案例分享 | 百度人力资源大数据实践

接下来讲指标体系，分为人才管理、运营管理、组织效能、文化活力、舆情分析这几个维度去做指标的建设。再往下分有200多个关键指标，都有详细定义。把这些指标推行到“选用育留”层面，能做哪些事情呢？指标的解读，用“选用育留”来划分的话，过去大家更多强调“多、快、好、省”，少花钱多办事、办更多的事，现在我大家要求的是价值输出，更强调ROI，无论做业务体系还是做职能体系，ROI这是老板最关注的。我们也要转变思路，从原来的“多、快、好、省”转变到价值输出层面。具体的做法，比如基本分析可以分很多维度：组织，序列、层级、幅度、绩效、薪酬等。模块指针可包括，关键人才分析，入职来源，离职去向，人力资源现状分析，过去三年同比环比等等都是基础的东西，很多企业也是这么做的。

现在来看一些实例：三年前1.0版本，我们也有仪表盘，离职率、调入调出、升职降职等可以动态地去展示；2.0时代我们又对人才内部流转情况做了分析，虽然都是小的地方，比如入职来源，内部调转情况和离职去向，比方入职的时候，是阿里来的人多还是腾讯来的人多；离职的时候去华为的人多还是去阿里的人多，这些都是动态展示。同时也有个人全景的展示，可以对人才进行盘点，如同买车一样可以“货”（能力）比三家，晋升的时候人才也可以逐条数据对比。包括用户画像和人才九宫格的盘点，都会有动态展示。

再讲一个场景，2014年下半年的时候我们开始大数据应用尝鲜，其中之一就是研究360度评估中Peer的选择能否可以通过系统就能计算出工作关系最紧密的一些人出来呢进行打分。评估中Peer的选择大多做法是由HR或主管来确定，那我们能不能借助大数据的手段，根据平时的工作紧密程度，让系统来推荐合适的人来做评价呢，而不是让主管、HR可能有些主观地去确定人选呢？经过2个多月的研究与探索，通过模型与算法、校验与优化，成功地在秋季评审中小试牛刀，可以把工作关系紧密的十个人推荐过去，同时保留了灵活度可供HR或主管去调整名单，对这十个人进行勾选。这样的结果会更客观更逼近事实。

案例分享 | 百度人力资源大数据实践

另外一个大数据运用的例子，红黑榜，对内部评论情况可以及时地进行分析，数据沉淀，从而为采取相应的措施提供参考依据，也能看到整体在变好。

管理风险层面，举例来说随着国际化全球人才入库，会带来很多管理风险，尤其我们核心员工或管理者，一举一动都对产品、业务方向有很大的影响。这一块我们也有产品去考虑个人风险和整个大盘风险的高低比较，同时提供其离职对下属影响的分析和预警。关键岗位的个人离职会不会对下属的影响最大，我们有数据支撑，而且会提前一个月预判有可能会离职的人，以便采取可能的措施避免更大的损失。在个人离职预测方面，通过机器学习，模型校验与优化，不停迭代，查全率、查准率都很高，可以提前预知有可能有离职意向的关键人才，从而采取相应的保留措施，避免用人风险以及更多的损失。

对于整个人力资源大数据研究与探索来讲，概括起来可以是三个层面：一是看山是山，看水是水，这一阶段是要找事情的本源是什么；第二层是看山不是山，看水不是水，眼见的都不一定是事实，背后可能有故事，这个HR应该有体会；第三层是看山还是山，看水还是水，这就需要有洞察，通过事物表面的现象看清背后的本质，从而提前去预防预测，就像扁鹊大哥一样，病还未发起，就能给出可行的解决方案来了，并能治好。

当然了，我们也一直在路上，也希望和大家一起共同交流，把大数据在人力资源领域的应用做得更深更广更好，谢谢大家。

注：本文摘自eHR协会微信公众号“eHR”，转载请务必标明来源。

本文采用「CC BY-SA 4.0 CN」协议转载自互联网、仅供学习交流，内容版权归原作者所有，如涉作品、版权和其他问题请给「我们」留言处理。