干货 | Data Science求职攻略(上)
►攻略上篇内容概览:
前言
导师背景
职业方向规划
工作内容维度
►前言:
在攻略正式开始前,先分享一些找DS实习时的内心OS,相信不少正在准备DS招聘的同学一定能找到共鸣。
“开学两个月要找实习了,我会coding,ML,数学,自我感觉良好”
“上Glassdoor一搜相关岗位,有intern SDE, research scientist, data analyst, quant researcher, quant trader, etc. 难怪都说DS机会多,原来这么多方向可以选,那找到工作岂不是贼稳”
“每天投20个公司,10天就能投200个,总能中一个的”
“懒得去为了每个岗位细节修改简历了,太麻烦了,我的简历本来就很好了”
“找refer也太耗时间了吧,算了直接投,应该有戏的”
“拿了两个大厂和若干小厂的OA和takehome,没精力浪费在小公司上,all in准备大厂”
“诶这OA怎么这么难?没事,我做不完别人也没机会”
“这SQL还能这样考?我面的是data scientist怎么还考business case?”
“怎么还考数学题,beta distribution谁还记得?pardon me,什么blackshore?”
这样一轮申请的结果当然是颗粒无收而且试错的成本是极高的,因为很多顶级公司的机会读研期间有且仅有一次。所以PH求职为了帮更多同学少走弯路,抓住每一次宝贵的机会,今天由DS求职经验丰富且斩获多家顶级大公司全职offer的金牌Ricky导师来分享他的求职心得。
►导师背景:
Ricky导师:2019十一月感恩节前拿到了Expedia,McKinsey 和Facebook的全职DS offer,为求职季画上了一个句号。能够比较早的结束申请季并有选择的空间是真的非常幸运。
为了避免很多学弟学妹犯我犯过的错误就来分享一下我的求职经验。需要注意本文是并不是关于拿到具体某个公司的经验或者面经,而是关于作为一个典型北美DS master的整个求职过程的回顾和思考。
附上offer截图证明:
通过简历关是一个录取率从0到大于等于0的飞跃,简历上呈现的个人背景无疑是起决定性作用的。作为NYU数学本科,NYU DS master,我本科时期并没有太多DS相关经历,所以读研期间我花了大量时间,尽我所能的完善简历上实习,科研,GPA三个方面,所有选课,时间安排都是求职driven。
►职业方向规划:
求职的第一步是知道自己要投什么。了解自己最适合的,最擅长的工作需要大量的research和对自身的认知,绝非易事。一个普遍的想法是找工作效率这么低,为什么还要限制自己只投某一两个方向呢,应该采用遍地撒网。
这个想法个人觉得弊端众多:一是需要改出多个版本简历,相比只精修出一版难度陡增,二是target岗位太多增加找refer的难度,很多公司都是抱着侥幸心理自己一投了之导致拿到面试概率极低,最后就是各个细分岗位面试差异性极大,多岗申请会大幅dilute准备面试的专注度,一般都是拿到某个面试才真正开始准备面试内容,最后顺利输出一篇跪经。
这不是否认海投,而是否认盲目无计划地,抱着侥幸心理地海投。我接下来会从多个维度讲解如何找到属于自己的segment,bias是一定存在的,如果有什么偏差就当我是对的吧。
►工作内容维度:
DS专业对应可以申请的方向非常广,每个方向的侧重和面试内容大相径庭。我会给出每个岗位的一个相关描述,关键词,我所知道的具体公司岗位名称(只限于new grad master可申请)以及大厂大概工资水平(total compensation for first year)。
- Analytics
描述:用各种统计方法,数据分析来找出现存的产品问题,提出优化方案,需要极强SQL coding skill, 交流能力和产品理解能力,对algorithm几乎没有要求。
关键词:data analysis, experiment (A/B testing), statistical inference, visualization, SQL, presentation, simple ML model, Product interpretation
例子:Facebook (Intern/full time) Data Scientist Analytics, Airbnb Intern Data Scientist Analytics
工资:140-200k
- Research
描述:研究,开发,使用新的ML techniques来解决主流模型难以解决的问题。需要很强的research,数学,ML,和自主开发能力。一般来说大厂的这个岗位偏爱博士,但也会招一些硕士。
关键词:data structure, independent research, model design, implementation, deployment, literature review
例子:Amazon(Intern/Full-time) Applied Scientist, Facebook Research Scientist
工资:160-250k
- ML
描述:专注于使用ML model解决各类实际问题,会花大量时间分析问题做feature engineering。不会涉及过多research,对ML知识有极高要求。一般来说大厂的这个岗位偏爱博士,但也会招一些硕士。
关键词:Machine Learning Model implementation, data wrangling, domain research
例子:Microsoft (Intern/full-time) applied/data scientist, Facebook (Intern/full-time)Data Scientist Infrastructure
工资:160-200k
- DE
描述:Architect, implement and deploy new data models and data processes in production。对SQL要求极高,需要掌握数据储存,清理,调用。此岗对new grad开放机会不多,但基本都是master或本科学历即可。
关键词:Data Processing, Data warehouse, Data storage, SQL and database
例子:Facebook (intern/full-time) data engineer
工资:140-200k
- Data Science Consultant
描述:使用任何ds相关知识解决客户提出的具体问题。需要极强的沟通,汇报,总结能力以及简单ML model的理解。对短时间学习,搜索能力要求同样很高。
关键词:communication, presentation, model interpretation, fast execution, data analytics, fast learning, traveling
例子:McKinsey/BCG Gamma (intern/full-time) data scientist
工资:120-160k
- SDE
描述:码农机会之多,工资之高,面经之多不必多言。但leetcode也不是那么好刷的。本科,研究生都有较多的机会申请SDE,可对algorithm要求很高,面试容错率极低。
关键词:Software development, data structure, model implementation, deployment, web development
例子:Google/Facebook/Amazon/LinkedIn (Intern/full-time) SDE
工资:140-250k
- Quant
描述:分为买方/卖方,卖方主要为投资银行,买方包括对冲基金、资产管理公司等;具体岗位可分为quant researcher, quant trader, portfolio analyst,risk analyst等。不同公司、岗位对能力的要求各有侧重。但一般都是要求数学、统计、编程、金融四个方面的知识储备。工作中需要使用数学、编程等解决金融市场问题。有的岗位也会要求比较强的people skill,而有的研究岗位则更强调independent research的能力。关键词:Financial markets, data analysis, time series, statistical inference, Python
例子:某顶级投行 (Engineering/Strats), Citadel Quantitative Researcher, Blackrock Quantitative Analyst, Akuna Quantitative Trader
工资:130-350k
Ricky导师的Comment:经典的混合申请套餐有如下,
DS analytics + data science consultant + DS MLResearch + Quant + SDESDE + ML + QuantDS analytics + DE
我个人走的是第一个路线,full-time拿到面试的三家公司正好一一对应。C3.ai 是DS ML和consulting结合,McKinsey 显然是consulting,Facebook是DS Analytics。我的准备面试重点是product interpretation, experiment, data science case study, SQL, ML。
PH导师Howard选择的是第三个路线,需要大量刷Leetcode并对ML model的具体implementation非常熟悉。
►攻略下篇内容预览:
- 项目优势和个人兴趣维度
- 地点维度
- 求职申请要点
- 其他注意事项
► 结语:
PH求职会继续不忘初心!用最一手、最专业的信息与态度帮助大家用最触手可及的成本去最优化申请效果!