数据科学的细分职业这么多,到底哪一个最适合我?








全文共2569字,预计学习时长9分钟
 
图源:unsplash
 
几周之前,我在外面遛狗时碰到了一位邻居。她向我询问这一行业中有哪些不同的职位,想为跳槽做好打算。我为她指明了不同工作的职责,她显然有些惊讶,承认道:“我都不知道这个行业原来有这么细致的区分”。其实,像她这样的人还有很多。

毫无疑问,在过去的几年中,和数据有关的职业成为了求职市场中的热门。但很多人可能对它不甚了解,只知道这是个令人心动的行业。实际上,数据科学这一领域的细分职业很多,数据科学家、数据分析师、数据工程师傻傻分不清楚?
 
本文将带你厘清不同职业的本质,下次就不用糊里糊涂地投简历了。
 

数据分析师

数据分析师的主要责任是找出重要的商业问题并进行处理,让公司能在数据的基础上做出更明智的决定。

数据分析师要具备广泛的技能,要收集大量的数据并进行整合,从中提炼出自己的看法。数据分析师必须具备分析能力和技术能力,并且要熟练掌握ETL工具,数据可视化以及各种语言或技术,比如:R, Python, SQL, SAS等。
 
数据工程师
 
数据工程师是团队中的“建设者”。有人将他们称作数据领域的开发运维者。不同的公司对其职责的定义也不同,但我觉得数据工程师的工作是其他职务的基础,比如数据科学家、数据分析师等。

因此,数据工程师也被委以重任,为整个公司建造并维护大数据生态系统,同时还要确保其表现良好、运行顺畅。

数据工程师要对诸如Hadoop, Hive, MongoDB, MySQL等数据系统有很强的悟性。此外,他们还要实际操作数据流工具、ETL工具,掌握数据建模。
 
数据科学家
 
不仅仅是在数据行业,甚至对整个科技领域来说,数据科学家很明显都是最受追捧的职位。我认为数据科学家之所以吸引了很多行业人才是因为数据科学从定义上来讲连接了三个重要的领域:编程、数据以及商业知识。数据科学家必须是数据、数学以及编程语言方面(比如:Python, R,Scala)的专家。
 
图源:unsplash

数据科学家的工作还需要一定的创造力,因为他们要从商业问题开始研究,并找到解决这个问题的最优办法,期间要使用许多先进技术,比如预测分析。

他们会针对观察展开研究,要进行这些研究就必须深度分析数据,直到能发现这些数据的模式、沿袭及行为,之后数据科学家还要思考如何利用这些发现来帮助自己的企业发展。

 商业分析员

尽管商业分析员不像其他职务那样注重技术性,但是商业分析员仍然在数据行业占领着重要的位置,因为他们是联结技术人员和商业管理人员的纽带。商业分析员必须对他们所处行业及业务流程有着深入的理解(比如:医疗、保险、金融行业)。

作为纽带,他们必须会写报告,熟练掌握将数据可视化的技能,并且要善于和人沟通。
 
机器学习工程师

机器学习工程师是一个需求量很大的职位,其工作职责和数据工程/数据科学有一些重叠。

机器学习工程师能弥合数据科学家和技术之间的鸿沟,从而让数据科学家的工作成果能运用到生产中,或是能推动企业发展。他们的工作内容包括建造数据管道,将模型投入生产,公开API,训练模型以及进行A/B测试。

机器学习工程师要熟练掌握机器学习方面的众多知识(比如:Tensorflow, NLTK),具备编程经验,相当了解SQL, Rest APIs及其他的相关技术。
 
数据库管理员
  
数据管理员这个职位大家一定不陌生。他们负责建立并维护数据库,这是非常重要的工作。数据管理员要对公司的数据库安全负责,一般来说,他们掌握着公司里最重要的资产之一。

图源:unsplash

数据管理员的工作内容包括:管理访问数据库的通道(授权或撤回等),计划并存档日常的备份(及恢复),计划并执行安装及更新,监管数据库并对其性能进行优化。

数据管理员最主要的职责就是对他们管理的数据库负责。
 
ETL 开发人员
  
简单来说,ETL开发人员负责将数据从源数据库转到目标数据库,在这一过程中还要进行监管和测试,出现问题时要及时修复。在大型的系统中,这种转换过程十分常见,因此也比较重要。

ETL开发人员必须熟练掌握以下内容:ETL工具(比较流行的有:Talend,Informatica, Datastage),SQL,脚本语言以及建模工具。
 
数据架构师
 
数据架构师是整个团队的粘合剂,尤其是技术方面的粘合剂,主导所有的架构工作。他们的工作包括绘制蓝图,为具体展现数据库流和集成点而制作文件,对工程师的工具进行评估并判定是否准许其使用。数据架构师相当于一位“守门人”,通过一些必需的安保措施来确保公司的数据得到了加强保护。

图源:unsplash

在我看来,数据架构师要成为“万金油”,他们必须对数据技术有深入的了解并且熟练掌握,同时他们还要跟进最新的技术发展。

商业智能开发工程师
 
尽管在过去几年中,我们大部分的注意力都转向了人工智能,但我们同样不能忘记商业智能的重要性。人工智能及商业智能都是通往成功的关键,也是现代企业做出决策的关键。

商业智能开发工程师的工作主要是开发及维护商业智能交互界面:数据可视化及控制面板,报表及查询工具。对于商业智能开发工程师来说,必须掌握的有:SQL, OLAP, ETL,此外还要非常熟悉商业智能系统:Power BI, Qlik Sense等。
 
数据产品经理
 
数据产品经理主导本公司数据策略的制定,同时还要监管产品组合,期间要考虑到数据的利用以及如何与企业远景保持一致。

首先,数据产品经理归根到底还是产品经理。总的来说,产品经理会决定公司的发展路线,通过和公司内外的利益相关者合作来确保公司的发展。产品经理就是整个项目的“粘合剂”。

此外,数据产品经理要确保公司最大化利用了数据的价值,并以此在商业上取得了最佳成果。在一些情况下,他们要向企业高管展现利用数据带来的好处,并在此基础上改变高管的看法,同时,数据产品经理还要确保整个公司都能对数据进行更好的利用。
 
图源:unsplash

数据的力量逐渐被各个行业认识到了 ,除了科技公司,数据人才也越来越受到其他公司的青睐。需要注意的是,不同公司对于同一职业的定位不尽相同。如果你想应聘数据领域的工作,那么你一定要熟悉该领域的不同职位,了解它们之间的区别,因为有些时候这些职位之间的区别可能微乎其微甚至有所重叠。
 
除此之外,世界中还有许许多多其他的工作,每种工作都有不同的挑战,需要掌握一定的技能。快去找到最适合你的工作吧!
 

推荐阅读专题


留言点赞发个朋友圈
我们一起分享AI学习与发展的干货

编译组:方媛、王品一
相关链接:
https://www.kdnuggets.com/2020/04/find-perfect-fit-data-job-roles-guide.html

如转载,请后台留言,遵守转载规范

推荐文章阅读

ACL2018论文集50篇解读
EMNLP2017论文集28篇论文解读
2018年AI三大顶会中国学术成果全链接
ACL2017论文集:34篇解读干货全在这里
10篇AAAI2017经典论文回顾

长按识别二维码可添加关注
读芯君爱你