硅谷数据科学家谈谈研究生data science选校,AMA
67276265
最近在地里看到很多同学都拿到心仪的 offer,首先恭喜你们啦!!有的朋友还拿到了好几个offer,十分纠结去哪家。有的学校名气大,有的地理位置好,有的课程好,有的据说 career service 好,那么哪个因素比较重要呢?我当年也有类似的困惑,做选择的时候也纠结了好长时间。下面我从一个数据科学行业过来人的角度来给大家说说怎样选到适合自己的 data science / business analytics 项目。希望能够帮到大家!
先说说我的背景,我从 CMU MISM-BIDA 项目毕业两年,现在在硅谷的某科技大厂做data scientist。我目前呆过两家公司,分别做过偏 analytics 方向的 ds 和偏 machine learning 的 ds,所以对两种不同类型的data science都有所了解。
对于data science行业不同岗位(analyst vs scientist vs engineer),我还有另外一个帖子做了详细的介绍,不太能分得清的同学可以去看看。instant.1point3acres.cn
对于选择项目很重要的一点就是要根据自己的背景和兴趣点来选择一个适合自己的方向。如果是数理背景比较强,学习代码不吃力的同学一般都会想做偏 machine learning 的 data scientist 或者 machine learning engineer。如果是商科背景,分析能力和交流能力很强的同学可以考虑下走data analyst或者data scientist analytics方向。如果喜欢做偏工程一点的活,本身对数据处理也感兴趣的话就可以考虑 data engineer。了解了自己适合的方向之后,再根据每个岗位需要的技能,对比目标项目开设的课程就不难做出选择了:
Data Scientist - ML / ML Engineer: 核心技能 ML + algorithm coding。对应课程 machine learning,deep learning,NLP,CV,data structure and algorithms,database,big data systems。E.g. airbnb data scientist algorithms, careers.airbnb.com
Data Scientist - Analytics (including data analyst): 核心技能 SQL + data analytics + communication。对应课程 database,business analytics,statistics,causal inference。E.g. FB data scientist analytics, facebook.com
Data Engineer: 核心技能 Data ETL + coding。对应课程 database,data warehouse,big data systems,distributed systems,data structure and algorithms。E.g. FB data engineer, facebook.com
以我工作的经验来看,不同的岗位工作状态还是蛮不一样的。比如data analytics主要和商业产品组一起工作,有很多的 data request 和 ad hoc analysis,然后做出来的分析有比较大的 business impact;ML的岗相对来说做的项目偏长期,偏研究,也不会有很多来自PM的 data request。选对一个适合自己的track是最最最重要的,确定之后就能缩小自己的选校范围。比如,如果你喜欢做ML类型的data scientist,那么基本上不用考虑 business analytics 的项目了,而是应该去data science,statistics 或者 computer science 项目。这样你才能选得到相应的课程,掌握以后工作所需的技能。但是仅仅从项目名有时候也不能完全判断,比如我当时去的项目名字叫 business intelligence and data analytics,听起来比较像是 business analytics。但是因为我们选课的自由度挺大的,不少人到CS院选ML,DL和算法相关的课程,最后找到的是偏ML的data scientist工作。我的意思是选择项目之前最好和这个项目的学长学姐联系一下,问一下他们可以选到什么样的课程,最后的就业是什么方向。有的时候光从网站上面是没有办法知道具体情况的。
下面再来说说选择 data science / business analytics 项目的时候,有哪些因素是比较重要的。
1)就业。就业就是最重要的,没有之一。出国读了一个master 项目,花了大几十万到一百万的人民币,肯定是希望快点找到一个好工作把花出去的学费都赚回来。如果找不到自己喜欢的工作,前面的努力都白费了。怎么看就业情况呢?有一些项目会把每年的就业情况放在项目网站上,这说明这个项目对他们的就业结果比较自信。
比如CMU MISM-BIDA 的就业报告上有薪资,地点,和每个人的公司岗位,heinz.cmu.edu
有的项目没有详细的就业报告,这种情况不一定是项目的就业不好,但是一定要找到上一届的同学打听就业情况,以免踩雷。我当时就是看到了上一届的就业报告才决定去了CMU。
2)地理位置。地理位置对于找工作也是非常重要的,很大程度上决定了你那面试的难易程度。这是因为有的公司会对本地的学校项目比较了解所以有所偏好,而且给 onsite 的时候也不用帮忙报销机票酒店,成本比较低。对于DS来说,工作机会比较多的还是在加州和纽约,所以地理位置比较近的学校这方面会有优势。我在硅谷这边工作就深切体会到这一点,有的项目比如 USF 的 data science,学校没有什么名气,但是这个项目的就业是真的好,不会比 CMU,Stanford之类的学校差。然后有的学校比如CMU,地处匹兹堡,但是加州和纽约的公司也很认可,这是因为CMU在科技行业的名声很好,可以弥补地理位置上的劣势。
3)课程。课程也是一个比较重要的因素,正如我上面所说,不同 track 的 data science professional 需要的技能不一样,要选修的课程也不一样。所以要提前看好想去的项目里面有没有相应的课程让自己获取相应的技能。如果上不到相应的课程,就算去的学校再好,也有可能做不到自己想做的方向。选课的灵活度其实也是一个非常重要的因素,因为很多人其实在入学前给自己设定好了一个方向,但是在入学之后可能因为对行业更深入的了解,或者因为发现另一个岗位机会更多而改变自己的方向。这个时候选课灵活度高的优势就体现出来了。
4)校友资源。为什么校友资源重要?因为找工作一方面靠的是个人实力,还有一点就是和不同企业的联系。如果能找到校友提前了解到他们公司相应岗位都在解决什么问题,并且得到校友的推荐,是不是拿面试和通过面试的概率都能大大提高?那么怎么知道哪个项目的校友资源比较好呢?其实很简单,就到LinkedIn上面搜一搜这个项目毕业的学生,看有多少是去了你想去的公司和岗位。有时候校友资源比学校的 career service 更加重要,因为校友可以提供更具体的帮助,比如怎么准备某一个公司的某一个岗位的面试,而 career service 只能帮助准备一些比较 general 的问题。
先说说我的背景,我从 CMU MISM-BIDA 项目毕业两年,现在在硅谷的某科技大厂做data scientist。我目前呆过两家公司,分别做过偏 analytics 方向的 ds 和偏 machine learning 的 ds,所以对两种不同类型的data science都有所了解。
对于data science行业不同岗位(analyst vs scientist vs engineer),我还有另外一个帖子做了详细的介绍,不太能分得清的同学可以去看看。instant.1point3acres.cn
对于选择项目很重要的一点就是要根据自己的背景和兴趣点来选择一个适合自己的方向。如果是数理背景比较强,学习代码不吃力的同学一般都会想做偏 machine learning 的 data scientist 或者 machine learning engineer。如果是商科背景,分析能力和交流能力很强的同学可以考虑下走data analyst或者data scientist analytics方向。如果喜欢做偏工程一点的活,本身对数据处理也感兴趣的话就可以考虑 data engineer。了解了自己适合的方向之后,再根据每个岗位需要的技能,对比目标项目开设的课程就不难做出选择了:
Data Scientist - ML / ML Engineer: 核心技能 ML + algorithm coding。对应课程 machine learning,deep learning,NLP,CV,data structure and algorithms,database,big data systems。E.g. airbnb data scientist algorithms, careers.airbnb.com
Data Scientist - Analytics (including data analyst): 核心技能 SQL + data analytics + communication。对应课程 database,business analytics,statistics,causal inference。E.g. FB data scientist analytics, facebook.com
Data Engineer: 核心技能 Data ETL + coding。对应课程 database,data warehouse,big data systems,distributed systems,data structure and algorithms。E.g. FB data engineer, facebook.com
以我工作的经验来看,不同的岗位工作状态还是蛮不一样的。比如data analytics主要和商业产品组一起工作,有很多的 data request 和 ad hoc analysis,然后做出来的分析有比较大的 business impact;ML的岗相对来说做的项目偏长期,偏研究,也不会有很多来自PM的 data request。选对一个适合自己的track是最最最重要的,确定之后就能缩小自己的选校范围。比如,如果你喜欢做ML类型的data scientist,那么基本上不用考虑 business analytics 的项目了,而是应该去data science,statistics 或者 computer science 项目。这样你才能选得到相应的课程,掌握以后工作所需的技能。但是仅仅从项目名有时候也不能完全判断,比如我当时去的项目名字叫 business intelligence and data analytics,听起来比较像是 business analytics。但是因为我们选课的自由度挺大的,不少人到CS院选ML,DL和算法相关的课程,最后找到的是偏ML的data scientist工作。我的意思是选择项目之前最好和这个项目的学长学姐联系一下,问一下他们可以选到什么样的课程,最后的就业是什么方向。有的时候光从网站上面是没有办法知道具体情况的。
下面再来说说选择 data science / business analytics 项目的时候,有哪些因素是比较重要的。
1)就业。就业就是最重要的,没有之一。出国读了一个master 项目,花了大几十万到一百万的人民币,肯定是希望快点找到一个好工作把花出去的学费都赚回来。如果找不到自己喜欢的工作,前面的努力都白费了。怎么看就业情况呢?有一些项目会把每年的就业情况放在项目网站上,这说明这个项目对他们的就业结果比较自信。
比如CMU MISM-BIDA 的就业报告上有薪资,地点,和每个人的公司岗位,heinz.cmu.edu
有的项目没有详细的就业报告,这种情况不一定是项目的就业不好,但是一定要找到上一届的同学打听就业情况,以免踩雷。我当时就是看到了上一届的就业报告才决定去了CMU。
2)地理位置。地理位置对于找工作也是非常重要的,很大程度上决定了你那面试的难易程度。这是因为有的公司会对本地的学校项目比较了解所以有所偏好,而且给 onsite 的时候也不用帮忙报销机票酒店,成本比较低。对于DS来说,工作机会比较多的还是在加州和纽约,所以地理位置比较近的学校这方面会有优势。我在硅谷这边工作就深切体会到这一点,有的项目比如 USF 的 data science,学校没有什么名气,但是这个项目的就业是真的好,不会比 CMU,Stanford之类的学校差。然后有的学校比如CMU,地处匹兹堡,但是加州和纽约的公司也很认可,这是因为CMU在科技行业的名声很好,可以弥补地理位置上的劣势。
3)课程。课程也是一个比较重要的因素,正如我上面所说,不同 track 的 data science professional 需要的技能不一样,要选修的课程也不一样。所以要提前看好想去的项目里面有没有相应的课程让自己获取相应的技能。如果上不到相应的课程,就算去的学校再好,也有可能做不到自己想做的方向。选课的灵活度其实也是一个非常重要的因素,因为很多人其实在入学前给自己设定好了一个方向,但是在入学之后可能因为对行业更深入的了解,或者因为发现另一个岗位机会更多而改变自己的方向。这个时候选课灵活度高的优势就体现出来了。
4)校友资源。为什么校友资源重要?因为找工作一方面靠的是个人实力,还有一点就是和不同企业的联系。如果能找到校友提前了解到他们公司相应岗位都在解决什么问题,并且得到校友的推荐,是不是拿面试和通过面试的概率都能大大提高?那么怎么知道哪个项目的校友资源比较好呢?其实很简单,就到LinkedIn上面搜一搜这个项目毕业的学生,看有多少是去了你想去的公司和岗位。有时候校友资源比学校的 career service 更加重要,因为校友可以提供更具体的帮助,比如怎么准备某一个公司的某一个岗位的面试,而 career service 只能帮助准备一些比较 general 的问题。