博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
这份战略路线图,带你组建颠覆性的数据科学团队
阅读量:2107 次
发布时间:2019-04-29

本文共 3339 字,大约阅读时间需要 11 分钟。

全文共3128字,预计学习时长6分钟

也许在未来,你会拥有自己的业务甚至是事业,需要组建自己的数据科学团队。但从头建立一个团队不是一件容易的事情。本文将提供一份详细的战略路线图,包括招聘的策略建议,以及如何给予团队充分的支持。

2012年,《哈佛商业评论》的一篇文章将数据科学家评为21世纪最“性感”的职业。文中将数据科学家的角色定义为“数据黑客、分析师、传播者以及值得信任的顾问的综合体。这样的组合尤为强大,却很少见。”市场对这种稀缺组合的需求量很大。

2018年8月,领英人力分析报告表明,已经有151,000个数据科学岗位对民众开放,美国劳工统计局(BLS)则预计,在2026年实现该领域将实现两位数的就业增长率。和平均6%的增长相比,这无异于爆炸式增长。”

数据科学家是各个领域的通才,他们充分理解大数据的概念,并把其转化为有价值的实体。一个数据科学家需要精通技术,富有创造力。但是如果你缺少甚至缺乏聘用这些新兴知识工作者的经验,如何从头组建一支数据科学团队呢?下面是十大关键。

1. 确定雇用人选

令大众感到困惑的是,围绕“数据科学家”展开的职业描述多种多样。事实上,在数据科学内部有分明的四个角色,通常由四种不同的人担任。

· 数据理论家:取决于具体应用,这个领域的最高的附加价值人才,具备筛选原始数据的技术,有在正确语境下辨别数据模式和趋势的创造力和直觉。这是一门艺术,也是一桩对于科学的应用。在Coseer(一家硅谷创业公司),这些“万事通”已经写出了一个叫作Calibrated Quantum Mesh的全新算法,这种算法比起深度学习技术,更有利于自然语言应用。

· 数据工程师:下面介绍运用这些算法并且设计模型来解决问题的人们。在像谷歌、网飞等公司里,这些数据工程师就是运用深度学习技术来解决那些不可思议的挑战的人。

· 数据建模师:这可能是你听到“数据科学家”就会联想到的一群人。他们采用现有模型,运用相关数据来做出商业决策。比如,卷积神经网络对图像最有用。即使前方有光明大道,数据建模师也要不断地解决问题,比如弄清楚哪组图像最适合解决哪类问题。

· 数据分析师:他们的主要角色是捕获和清除数据,这样才能进行更高级的数据分析。乍一看,他们好像在消磨时间,但是他们的职责远远不止于此。有天赋的数据处理员有更大的附加价值。根据工时来看,数据分析师也是数据科学角色里最重要的一部分。

2. 不要依赖招聘人员

如果你作为一名雇佣经理都很难理解数据科学,招聘人员面临的难关可想而知。 你可能有些外行,但你已经可以应对招聘业务挑战,并了解你的企业。你完成了相关研究并阅读了上文第一部分中数据科学涵盖的不同角色。与人力资源专员相比,你更有能力做出影响所在领域的数据科学决策。

3. 具体切实,灵活机变

图片来源:unsplash.com/@joshcala

具体描述你的需求是一种很好的做法,但你要善于聆听关于需求的建议。考虑到优秀的数据科学家难以定义,且给人带来很多困惑,对团队需求越具体,就越容易被理解。

同时,请记住,数据科学家往往更适应不确定性。他们习惯于被不太了解他们的人管理。如果你释放出自己开放包容的信号,他们会很乐意向你展示他们创新的一面。如果你知道所有的答案,就不会雇用数据科学家。建立广泛的网络并保持开放的心态,往往可以找到令人惊异的解决方案。这样的解决方案你也许之前从未想过。

4. 不要孤立数据科学家

那篇称数据科学是21世纪最“性感”的工作的文章还提到数据科学家从根本上想要创造。他们希望“站在桥上”——在行动的中心,观察和应对不断变化的情况,并影响真正的变化。

他们不能单枪匹马地做到这一点。他们需要合适领域的专家润色数据。语境是将可操作的观点与噪音分开的关键。确保数据科学家与产品管理、业务开发、工程部门尤其是面向客户的人员之间存在便捷、自由流动的沟通环境。你将获得更好的解决方案,数据科学家也会更愉快。

5. 对你的技术堆栈持开放态度

还记得我们说过,要对需求持开放态度吗?对技术也要同样开放。是的,人工智能是一个了不起的工具,它正在改变企业的一切,但它不能为每个问题提供解决方案。像线性回归这样不那么华丽的技术,常常可以让你更快地实现解决方案,并且可以在没有高级人工智能的情况下解决许多大数据问题。

如果你决定采用人工智能路线,请记住人工智能不仅仅是深度学习技术。例如,如果数据是非结构化的(比如电子邮件,科学论文,图像或音频),或者想在不耗费大量培训时间或费用的情况下快速获得结果,那么NLS(自然语言搜索)解决方案可能更适合你。

你的数据科学家都接受过培训,有能力确定最佳解决方案,因此要明白,那些“酷炫的”算法可能不能胜任繁重的工作。

6. 开展世界级的面试

数据科学招聘没有“检查清单”,但这并不全是坏事。事实上,数据科学欢迎多种创新形式。根据实际数据提出开放式问题,可以看到数据科学家的思维过程。这对于确定他/她如何应对业务挑战至关重要。

7. 管理期望

这是数据科学,不是魔术。即使用最先进的培训和工具,新组建的团队也需要时间来学习系统、数据结构和策略。过程进展可能没有你想象的那么顺利。项目也可能会起步缓慢。

听取数据科学家们就新的软件/硬件提出的要求,并在开展任何大型项目之前给他们时间清理和组织数据。记住“冰冻三尺,非一日之寒”,在调整期结束时获得的高质量数据将升值一百万倍。

8. 力求准确

充分理解人工智能的良性循环。一个伟大的产品会吸引用户,用户会在每次使用时向引擎添加数据,从而改进产品。没有人会使用没有结果产出的工具。有没有想过为什么一个公司的内网搜索能力差? 因为它从一开始就设计得不好,导致用户使用积极性不高。没有用户使用它,它永远不会变得更好。

每个Boss都很高兴看到结果,但是一定要抵制冲动,不要给新成立的数据科学团队设定太紧迫的完成期限。没有人希望他们推出一个没有人会用的半成品,这会浪费每个人的时间。

9. 记住招聘趋势

到目前为止,你已经组建了一支“摇滚巨星”级团队,但这个领域正在迅速发展。 数据科学包含如此多的技能,你需要拥有一支具备不同专业知识的团队。

 

市场对数据科学家的需求量很大,但他们扮演的角色却不尽人意。常见的问题包括:招聘人员对数据科学家期望错位,“办公室政治”盛行和部分员工遭受孤立。 你可以通过清晰的沟通,分配跨职能项目,以及为数据科学家提供实验空间和肯定他们的创造灵感来避免这种情况。 既然你是因为技术和创造力而选择这些人,那就不要浪费数据科学家们的才能。你最终会得到一个更快乐的团队,数据科学家们积极进取的精神,会让所有项目的发展远超预期,对业务产生重大影响,达成双赢的局面。

10. 补充合适的伙伴关系

你不能包揽所有事情。虽然你已经聘请了一支强大的新团队来完成繁重的工作,但是你仍然会遇到需要外援的情况。

与供应商进行战略性合作可以让你的工作更灵活,在其他地方很难获得这种成效。你将遇到意料之外的问题,但供应商会在需要时为你提供带宽,直到你向下一个学科前沿推进。不要抵触与多年来擅长解决不寻常的挑战的专家合作。

综上所述:

招聘数据科学家时,你会收到很多建议,这个过程听起来像是试图从一个小池塘捕鱼,同时与其他1000名渔民竞争。了解数据科学以及该领域有能力的人员,将为你提供更多的支持。

为了吸引优秀人才并让他们乐于为公司工作,需要有一个正确的企业文化基础,即基本了解数据科学领域,明白数据科学家能带来什么效益,熟悉一系列亟待数据科学家解决的现实疑难问题,以及给他们提供大方向和环境方面的支持。全世界都欢迎优秀的人才,因此留住这些有能力的人是工作中面临的最大挑战。这包括如何与人才对话,为他们提供解决问题创造空间。

托马斯·达文波特和D.J.帕提尔针对企业对数据科学日益增长的需求的精辟总结:“我们要将大数据视为正在蓄力的惊涛骇浪,它正在形成浪峰。如果想抓住这个机会,你需要会冲浪的人。”

算法的公平性也可以量化?试试这三个指标吧

留言 点赞 关注

我们一起分享AI学习与发展的干货

欢迎关注全平台AI垂类自媒体 “读芯术”

(添加小编微信:dxsxbb,加入读者圈,一起讨论最新鲜的人工智能科技哦~)

转载地址:http://kyfef.baihongyu.com/

你可能感兴趣的文章
Leetcode C++《热题 Hot 100-48》406.根据身高重建队列
查看>>
《kubernetes权威指南·第四版》第二章:kubernetes安装配置指南
查看>>
Leetcode C++《热题 Hot 100-49》399.除法求值
查看>>
Leetcode C++《热题 Hot 100-51》152. 乘积最大子序列
查看>>
[Kick Start 2020] Round A 1.Allocation
查看>>
Leetcode C++ 《第181场周赛-1》 5364. 按既定顺序创建目标数组
查看>>
Leetcode C++ 《第181场周赛-2》 1390. 四因数
查看>>
阿里云《云原生》公开课笔记 第一章 云原生启蒙
查看>>
阿里云《云原生》公开课笔记 第二章 容器基本概念
查看>>
阿里云《云原生》公开课笔记 第三章 kubernetes核心概念
查看>>
阿里云《云原生》公开课笔记 第四章 理解Pod和容器设计模式
查看>>
阿里云《云原生》公开课笔记 第五章 应用编排与管理
查看>>
阿里云《云原生》公开课笔记 第六章 应用编排与管理:Deployment
查看>>
阿里云《云原生》公开课笔记 第七章 应用编排与管理:Job和DaemonSet
查看>>
阿里云《云原生》公开课笔记 第八章 应用配置管理
查看>>
阿里云《云原生》公开课笔记 第九章 应用存储和持久化数据卷:核心知识
查看>>
linux系统 阿里云源
查看>>
国内外helm源记录
查看>>
牛客网题目1:最大数
查看>>
散落人间知识点记录one
查看>>