5个面试问题判断是否是一个好的数据科学家

对于我们这些从事这一行业的人来说,我们总是发现科学家严重短缺。事情在变好之前,往往会变得更坏,因为对机器学习,AI和深度学习的需求正处在一个上升的趋势。结果就是,我们发现很多人冲着高薪,从其他职业转型。这样的结果很明显,雇主们面临的问题是:并不能为你的空缺职位找到好的候选人。

作者:ODSC
编译:ronghuaiyang

导读

我们发现很多人冲着高薪,从其他职业转型。这样的结果很明显,雇主们面临的问题是:并不能为你的空缺职位找到好的候选人。

5个面试问题判断是否是一个好的数据科学家

对于我们这些从事这一行业的人来说,我们总是发现科学家严重短缺。事情在变好之前,往往会变得更坏,因为对机器学习,AI和深度学习的需求正处在一个上升的趋势。结果就是,我们发现很多人冲着高薪,从其他职业转型。这样的结果很明显,雇主们面临的问题是:并不能为你的空缺职位找到好的候选人。

那要怎么办呢?许多公司精心制作招聘广告,似乎是为了吓跑求职者。不是每个人都能胜任数据科学“独角兽”的角色,这个角色需要计算机科学和应用统计学博士学位,以及多年特定领域的经验。当然,也有勇敢的人在没有必要的知识和经验的情况下申请这些工作。你只需要有效地过滤掉骗子就可以了。

下面的短列表是我想到的一些东西,供招聘经理用于数据科学职位(不是数据工程师),以帮助淘汰那些在能力方面夸大事实的人。的确,许多科技公司在面试时都会包括令人精疲力尽的编码测试,但这些问题更加细致入微,更多地关注基础知识、深入基层的经验和数据科学常识。这样做的目的是看看他们是否掌握了基本知识,能否可以制定出可行的策略,能否切实的解决问题。

  • 正态分布对数据科学的意义是什么?本问题旨在展示对数据科学最基本要素之一的理解。如果答案涉及到中心极限定理的讨论,那就太好了,但这可能要求太多了。也许得到高斯概率分布函数的数学公式有点过头了。但除了提到的“钟形曲线”,这些也是是很高兴可以听到的东西:它的均值,中位数和众数都是一样的,整个分布可以仅使用两个参数——平均值和方差来表示,对线性回归的重要性的描述(数据科学的主力)。
  • 告诉我你对数据科学的热情。你是否参加过当地的会议、参与数据挑战(如Kaggle)、为公共利益(如公共数据黑客)使用数据、在会议上发言、撰写书籍或文章等?这个问题的重点是确定候选人是否认为数据科学是他们的真正使命。他们会思考和梦想数据吗?他们是否发现问题并立即寻找涉及数据模式的解决方案?他们的图书馆里有什么书?一个相关的问题是,数据科学的数学基础在多大程度上影响了他们对这门学科的看法?了解算法背后数学原理的数据科学家通常会表现得更好。
  • 描述上一次你在一个数据科学项目中遇到的挫折,你是如何克服它的?并非所有的数据科学项目都进展顺利,因为可能会出现许多潜在的障碍。这个问题探讨了他们真实经历的深度,以及他们如何处理不可避免的问题。缺乏知识和经验的人很容易暴露在这里。
  • 回想一下你过去参与的一个数据科学项目。如果要求你更改某个数据源,从而使用不同的预测器,你将如何更改解决方案?这个问题涉及到候选人之前所扮演的角色,以及他们如何适应不断变化的需求,比如引入新的数据集。很多时候,较低级别的数据科学家只是得到一个数据集,其中包含要使用的预测因子列表,而不提供任何有关其适用性的输入。另一方面,更重要的贡献者将涉及数据集选择、特征工程和统计分析。你可能希望你的团队有一个更全面的候选人。
  • 研究表明,在过去的20年里,有23亿人受到洪水的影响。描述你将如何处理一个数据科学项目来预测未来100-500年即将到来的洪水。这些预测可以用来在正确的地点建造水坝,以减少损失。这类问题,或者与你的特定行业相关的更多问题,需要考虑“数据科学过程”,包括问题制定、数据获取、数据争论、探索性数据分析、特征工程、数据建模(构建、适合和验证模型),以及用结果描述数据。候选人需要非常熟悉数据科学家的工作流程。

如果你正在寻找一个优秀的数据科学家,而不是一个仅仅要求一个头衔的人,那么上面的问题对于快速区分这两者是非常有效的。这些问题的好处是你可以根据你的行业甚至你的公司对可接受的答案进行微调。

英文原文:https://medium.com/predict/five-interview-questions-to-predict-a-good-data-scientist-40d310cdcd68

本文为专栏文章,来自:AI公园,内容观点不代表本站立场,如若转载请联系专栏作者,本文链接:https://www.afenxi.com/77722.html 。

(1)
AI公园的头像AI公园专栏
上一篇 2019-11-05 00:08
下一篇 2019-11-05 13:54

相关文章

关注我们
关注我们
分享本页
返回顶部