Data Informatics/Applied Data Science@USC 全总结
997832
Data Informatics / Applied Data Science 1point3acres.com USC 全总结
这里主要分为四部分,第一部分课程介绍,第二部分是师生情况及录取要求,第三部分是上课情况及就读感受,第四部分是就业信息。
第一部分:课程侧重点及课程介绍
1.1 课程侧重点
Data Informatics / Applied Data Science 课程设置是数据科学课+cs课,也就是说对于学生自身来说,可以偏data t方向或者cs方向,那么对应的就是找数据科学家/数据工程师和软件工程师的工作的区别。数据信息学属于比较小班化的专业,专业人数不算多,班小圈子也小,基本上你身边一起上课的同学,就是你未来找工作的过程中一直陪着你的伙伴。
1.2必修课
说一下曾经上过的课吧(本人偏data )首先是必修课
1.2.1 INF551-Fundations of data informatics数据信息学基础课(必修):
当时这门课上的是中国教授wensheng教的,课程内容很丰富,从底层的数据存储,到database,一直到大数据Hadoop的基础知识都有涉及,不过都是浅尝辄止,不算深入。虽然这门课既有小测,又有作业,还有project,更有final,但是课程load不大,拿A挺简单的,project好好做对于丰富简历还是很有用的。
1.2.2 INF552-Machine Learning for Informatics信息学下机器学习(必修):
当时上的是rajati的课,load偏重。课程内容主要是一些基础的machine learning的算法,每个算法都会有对应的作业要求你用目前的开源你包自己把它实现,更偏重算法的应用层面。好好上课好好写作业的话,拿A不难。是一门非常好的machine learning的基础课。(CS下还有进阶版的machine learning,要从底层手写实现算法,找工作时回答底层理论问题思路会更清晰,但实操层面相比inf552就差一些)
1.2.3 必修INF553-Data Mining数据挖掘(必修):
这是非常火的一门课,时常会有CS和其他专业的同学来蹭课。当时上的是台湾教授Yaoyi教的。课程内容主要是一些数据挖掘的算法,会涉及到很多不同的主题,比如推荐系统,社交网络等等。每一个主题都会有相应的作业让你来实现和应用这些算法。作业主要用的是spark+python/scala,这个技术栈对于找数据工程师的工作挺有用的。作业load比较大,但是最后大部分同学都能拿A。
1.2 选修课
CSCI 570: 算法设计课。如果本科不是cs的同学的话,对刷题很有帮助。从理论层面理解算法,没有编程的部分,都是伪代码。可去上课也可在家看视频。是一门比较难拿A或A-的课
INF558: 构建知识图。构建AI生态的基础。很多美国和中国的大公司都在构建他们产品的知识图谱,以用来做知识推理,问答,推荐等等。拿A不太容易,节节课quiz。对于回国的话,是一个加分点。
CSCI544: 自然语言处理: 这门课是john may和一个华人phd来教。课本身的内容是不错的。而且无论国内还是美国NLP都很火,如果想做机器学习方向,最好去上。SDE的话,听一听对文本处理也有一些帮助。
CSCI566: 深度学习: 这门课是一位韩国的computer vision phd老师来教学。入课第一节课需要做测试,但不是很难。这门课是在之前ML课的DL部分的深入,深度理解神经网络的原理,了解当前最新的模型。最后需要小组交一个DL的project,很多小组创意不错,做的也挺有趣。拿B+不难。
1.3 前期课程
入学前建议把python基础打牢,并且有比较夯实的数据结构,算法分析基础。本科CS的同学有时间把leetcode的medium热门题多刷一刷,其他专业的建议easy和medium的题刷一刷。能在入学前刷200道高频题对于进入项目和找工作是非常大的优势。
1.4 特色课程/实验室项目
INF553是金牌课程,建议选择。其他课程还是需要根据个人求职方向来讨论。
Viterbi学院下有很多研究机构和实验室可以参与,如Information Sciences Institute和Institute for Creative Technologies.这些机构都为研究生和博士生提供了很好的实习资源,进入项目后多查网站招聘信息或者多和老师陶瓷,一门课成绩不错的学生是很有机会进入这些机构带薪实习的($20-$50/h).
1.5 转专业/硕转博
一般会选择CS方向的博士进行深造。这个需要和教授多沟通。
第二部分:师生情况及录取要求分析
55%华人40%印度人 5%其他国家
平均三维:托福95+; gre315-325; GPA3.5+
第三部分:上课及就读感受介绍
3.1 授课方式及上课时间
由于专业人数较CS来说比较少,所以都是小班教学,基本都要亲自出席。而CS的会是200+人的大课,由于提供录制视频,有的学生选择在家上课。总的来说,本专业压力不小,2年下来平时出去休闲的不多。
3.2 课程难度及考核情况(整体概况)
总体来说,是中等难度,个别一两门课比较难。困难与否和平时下来花在刷题的时间有很大关系,如果很勤奋的刷题,那压力就大一些。多数同学都是至少可以拿B及B以上的。
3.3 就读感受及学习建议(整体)
如果打算回国,那么压力不大,好好刷牛客网即可。 但是如果想要在美国找好工作的话,平时需要很好的分配好上课,找实习,刷题的时间。明确好自己的求职和职业目标并根据自己的情况有果及因的制定相应的个人计划。否则平时只是休闲,社交,玩游戏,不那么努力的完成项目和作业的话,不出意外是找不到工作的,加上疫情影响,很多公司已经解雇了其20%的准备入职和在职员工,可想而知竞争之大。
3.4 毕业要求
只要不拿C就没有问题。似乎没人会考虑这个问题。
第四部分:就业信息
4.1 求职资源
4.1.1招聘会
每年会有两次学校级别的招聘和学院级别的招聘。学校级别的性价比不大,可能排一天队投不了几家,最后也没什么回应。学院的招聘,来的公司都很有针对性,所以建议积极参加,和hr聊得好的话可以立即进入校园面试,题目相对简单,并且容易拿到实习offer,从而最后拿到全职return offer。
4.1.2 校友圈
这个主要体现在linkedin上,来到学校后,需要花时间去经营自己的linkedin账号,多加相关专业和在职的校友,在找工作的时候能和他们聊一聊让他们帮忙内推你进入公司面试。
4.1.3学校周边名企
洛杉矶的互联网企业相比湾区少,滴滴北美研究院,hulu,snap,和一些耳熟能详的大厂的LA office。
4.2就业去向
专业一届50多人的样子,三分之二中国人和ABC,剩下是老印或者几个白人。抛开印度同学不说(不太了解,但似乎都找到工作了),华人基本95% 在美国找到工作,回国的是本来就打算回国发展的,也找到工作了(BAT华为字节跳动等)。 在美国找到工作的同学有fb,oracle,visa,Bloomberg,paypal, amazon(大多数去了), 以及其他Intenet/FinTech公司。90%的都是sde,10%是data方向相关的岗位。
对于数据信息学这个专业来说,找工作总体有两条路,一是Data Scientist/Data Engineer ,一是传统SDE。
先说Data Sceintist/Data Engineer,这两个算是新兴的职业,在美国这边需求目前还比不上SDE,比起SDE来说岗位缺口非常小(1:5),大部分偏向招phd或者有几年工作经验的,对应届毕业生不是特别的友好。但大家也比较看好这个职位未来的发展前景,以后的岗位需求也一定会增多,从目前来看,在美国想找到这个方向的职位,难度确实相比sde要大不少。不过,这个岗位在国内就是另一番景象了。国内各大公司都在广招数据挖掘,大数据分析方面的人才,所以数据信息学这个专业,对于回国找工作来说,还是挺有优势的。长远来看,数据信息学方向是个宽口径的方向,要求综合素质高一些。
再说SDE。SDE算是在美国最好找的工作之一了,这也是为什么现在都在全民转CS。数据信息学这个专业,在找SDE方面的工作上,优势不算大。主要是因为课程的相关性和专业的名称。所以,如果铁了心的只做sde,那么建议直接去CS专业(28学分或者37学分)。
4.3薪资情况
就应届生来说:
Sde: $110k – $130k
Data scientist / data engineer: $100k – 135k
4.4求职准备建议
在找工作的时候,两个track对于应聘者的要求是:
Data engineer:leetcode(medium to hard) + 分布式算法和pipeline的项目经历 + behavior question
Data Scientist:leetcode(easy to medium) + machine learning (理论上和部分的代码实现)+ 基本数理统计问题 + A/B testing + business sense + behavior question。
SDE: leetcode(medium to hard) + system design + 项目经历 + behavior question
可以看到对于sde的准备相对于另外两个来说,比较简单直接, 相对容易短期突击。另外两个需要同学在平时把课内项目做好并且自己找好的项目做,再自学课内没教的东西。不同方向各有各的乐趣,data engineer需要处理实时,高并发的数据处理挑战, 比如抖音。Data scientist需要理解具体行业需求,把需求转化为机器学习算法可以解决的问题,并且去验证解决方案是否能改善产品或者解决AI问题,但也确实不容易突击准备,除非第一年就开始慢慢着手准备,还是有很大概率找到的。
找工作最重要的就是对于以上的skill set有序的按照时间线准备以及尽可能早的找到实习,它将会为你找全职省去巨大的时间和精力,因为它简单一些,而且拿到return offer之后就可以随便玩了。
4.5 个人求职经验分享
对于数据科学类岗位的求职来说,这是一个系统性,综合性的准备过程,需要去去一亩三分地的数据科学板块浏览和探讨。这里没法长篇展开。
对于SDE的求职来说,就是尽可能的从一入学就很认真的刷leetcode题目,熟练350道题2遍算是一个能凑合地应对未来的求职面试问题的数字。
重要的事情说三遍
疯狂求米中!
疯狂求米中!
疯狂求米中!
求一波大米,谢谢未来的学弟学妹们
补充内容 (2021-1-30 09:37):
别只收藏不评分呀 大大们 😭
这里主要分为四部分,第一部分课程介绍,第二部分是师生情况及录取要求,第三部分是上课情况及就读感受,第四部分是就业信息。
第一部分:课程侧重点及课程介绍
1.1 课程侧重点
Data Informatics / Applied Data Science 课程设置是数据科学课+cs课,也就是说对于学生自身来说,可以偏data t方向或者cs方向,那么对应的就是找数据科学家/数据工程师和软件工程师的工作的区别。数据信息学属于比较小班化的专业,专业人数不算多,班小圈子也小,基本上你身边一起上课的同学,就是你未来找工作的过程中一直陪着你的伙伴。
1.2必修课
说一下曾经上过的课吧(本人偏data )首先是必修课
1.2.1 INF551-Fundations of data informatics数据信息学基础课(必修):
当时这门课上的是中国教授wensheng教的,课程内容很丰富,从底层的数据存储,到database,一直到大数据Hadoop的基础知识都有涉及,不过都是浅尝辄止,不算深入。虽然这门课既有小测,又有作业,还有project,更有final,但是课程load不大,拿A挺简单的,project好好做对于丰富简历还是很有用的。
1.2.2 INF552-Machine Learning for Informatics信息学下机器学习(必修):
当时上的是rajati的课,load偏重。课程内容主要是一些基础的machine learning的算法,每个算法都会有对应的作业要求你用目前的开源你包自己把它实现,更偏重算法的应用层面。好好上课好好写作业的话,拿A不难。是一门非常好的machine learning的基础课。(CS下还有进阶版的machine learning,要从底层手写实现算法,找工作时回答底层理论问题思路会更清晰,但实操层面相比inf552就差一些)
1.2.3 必修INF553-Data Mining数据挖掘(必修):
这是非常火的一门课,时常会有CS和其他专业的同学来蹭课。当时上的是台湾教授Yaoyi教的。课程内容主要是一些数据挖掘的算法,会涉及到很多不同的主题,比如推荐系统,社交网络等等。每一个主题都会有相应的作业让你来实现和应用这些算法。作业主要用的是spark+python/scala,这个技术栈对于找数据工程师的工作挺有用的。作业load比较大,但是最后大部分同学都能拿A。
1.2 选修课
CSCI 570: 算法设计课。如果本科不是cs的同学的话,对刷题很有帮助。从理论层面理解算法,没有编程的部分,都是伪代码。可去上课也可在家看视频。是一门比较难拿A或A-的课
INF558: 构建知识图。构建AI生态的基础。很多美国和中国的大公司都在构建他们产品的知识图谱,以用来做知识推理,问答,推荐等等。拿A不太容易,节节课quiz。对于回国的话,是一个加分点。
CSCI544: 自然语言处理: 这门课是john may和一个华人phd来教。课本身的内容是不错的。而且无论国内还是美国NLP都很火,如果想做机器学习方向,最好去上。SDE的话,听一听对文本处理也有一些帮助。
CSCI566: 深度学习: 这门课是一位韩国的computer vision phd老师来教学。入课第一节课需要做测试,但不是很难。这门课是在之前ML课的DL部分的深入,深度理解神经网络的原理,了解当前最新的模型。最后需要小组交一个DL的project,很多小组创意不错,做的也挺有趣。拿B+不难。
1.3 前期课程
入学前建议把python基础打牢,并且有比较夯实的数据结构,算法分析基础。本科CS的同学有时间把leetcode的medium热门题多刷一刷,其他专业的建议easy和medium的题刷一刷。能在入学前刷200道高频题对于进入项目和找工作是非常大的优势。
1.4 特色课程/实验室项目
INF553是金牌课程,建议选择。其他课程还是需要根据个人求职方向来讨论。
Viterbi学院下有很多研究机构和实验室可以参与,如Information Sciences Institute和Institute for Creative Technologies.这些机构都为研究生和博士生提供了很好的实习资源,进入项目后多查网站招聘信息或者多和老师陶瓷,一门课成绩不错的学生是很有机会进入这些机构带薪实习的($20-$50/h).
1.5 转专业/硕转博
一般会选择CS方向的博士进行深造。这个需要和教授多沟通。
第二部分:师生情况及录取要求分析
55%华人40%印度人 5%其他国家
平均三维:托福95+; gre315-325; GPA3.5+
第三部分:上课及就读感受介绍
3.1 授课方式及上课时间
由于专业人数较CS来说比较少,所以都是小班教学,基本都要亲自出席。而CS的会是200+人的大课,由于提供录制视频,有的学生选择在家上课。总的来说,本专业压力不小,2年下来平时出去休闲的不多。
3.2 课程难度及考核情况(整体概况)
总体来说,是中等难度,个别一两门课比较难。困难与否和平时下来花在刷题的时间有很大关系,如果很勤奋的刷题,那压力就大一些。多数同学都是至少可以拿B及B以上的。
3.3 就读感受及学习建议(整体)
如果打算回国,那么压力不大,好好刷牛客网即可。 但是如果想要在美国找好工作的话,平时需要很好的分配好上课,找实习,刷题的时间。明确好自己的求职和职业目标并根据自己的情况有果及因的制定相应的个人计划。否则平时只是休闲,社交,玩游戏,不那么努力的完成项目和作业的话,不出意外是找不到工作的,加上疫情影响,很多公司已经解雇了其20%的准备入职和在职员工,可想而知竞争之大。
3.4 毕业要求
只要不拿C就没有问题。似乎没人会考虑这个问题。
第四部分:就业信息
4.1 求职资源
4.1.1招聘会
每年会有两次学校级别的招聘和学院级别的招聘。学校级别的性价比不大,可能排一天队投不了几家,最后也没什么回应。学院的招聘,来的公司都很有针对性,所以建议积极参加,和hr聊得好的话可以立即进入校园面试,题目相对简单,并且容易拿到实习offer,从而最后拿到全职return offer。
4.1.2 校友圈
这个主要体现在linkedin上,来到学校后,需要花时间去经营自己的linkedin账号,多加相关专业和在职的校友,在找工作的时候能和他们聊一聊让他们帮忙内推你进入公司面试。
4.1.3学校周边名企
洛杉矶的互联网企业相比湾区少,滴滴北美研究院,hulu,snap,和一些耳熟能详的大厂的LA office。
4.2就业去向
专业一届50多人的样子,三分之二中国人和ABC,剩下是老印或者几个白人。抛开印度同学不说(不太了解,但似乎都找到工作了),华人基本95% 在美国找到工作,回国的是本来就打算回国发展的,也找到工作了(BAT华为字节跳动等)。 在美国找到工作的同学有fb,oracle,visa,Bloomberg,paypal, amazon(大多数去了), 以及其他Intenet/FinTech公司。90%的都是sde,10%是data方向相关的岗位。
对于数据信息学这个专业来说,找工作总体有两条路,一是Data Scientist/Data Engineer ,一是传统SDE。
先说Data Sceintist/Data Engineer,这两个算是新兴的职业,在美国这边需求目前还比不上SDE,比起SDE来说岗位缺口非常小(1:5),大部分偏向招phd或者有几年工作经验的,对应届毕业生不是特别的友好。但大家也比较看好这个职位未来的发展前景,以后的岗位需求也一定会增多,从目前来看,在美国想找到这个方向的职位,难度确实相比sde要大不少。不过,这个岗位在国内就是另一番景象了。国内各大公司都在广招数据挖掘,大数据分析方面的人才,所以数据信息学这个专业,对于回国找工作来说,还是挺有优势的。长远来看,数据信息学方向是个宽口径的方向,要求综合素质高一些。
再说SDE。SDE算是在美国最好找的工作之一了,这也是为什么现在都在全民转CS。数据信息学这个专业,在找SDE方面的工作上,优势不算大。主要是因为课程的相关性和专业的名称。所以,如果铁了心的只做sde,那么建议直接去CS专业(28学分或者37学分)。
4.3薪资情况
就应届生来说:
Sde: $110k – $130k
Data scientist / data engineer: $100k – 135k
4.4求职准备建议
在找工作的时候,两个track对于应聘者的要求是:
Data engineer:leetcode(medium to hard) + 分布式算法和pipeline的项目经历 + behavior question
Data Scientist:leetcode(easy to medium) + machine learning (理论上和部分的代码实现)+ 基本数理统计问题 + A/B testing + business sense + behavior question。
SDE: leetcode(medium to hard) + system design + 项目经历 + behavior question
可以看到对于sde的准备相对于另外两个来说,比较简单直接, 相对容易短期突击。另外两个需要同学在平时把课内项目做好并且自己找好的项目做,再自学课内没教的东西。不同方向各有各的乐趣,data engineer需要处理实时,高并发的数据处理挑战, 比如抖音。Data scientist需要理解具体行业需求,把需求转化为机器学习算法可以解决的问题,并且去验证解决方案是否能改善产品或者解决AI问题,但也确实不容易突击准备,除非第一年就开始慢慢着手准备,还是有很大概率找到的。
找工作最重要的就是对于以上的skill set有序的按照时间线准备以及尽可能早的找到实习,它将会为你找全职省去巨大的时间和精力,因为它简单一些,而且拿到return offer之后就可以随便玩了。
4.5 个人求职经验分享
对于数据科学类岗位的求职来说,这是一个系统性,综合性的准备过程,需要去去一亩三分地的数据科学板块浏览和探讨。这里没法长篇展开。
对于SDE的求职来说,就是尽可能的从一入学就很认真的刷leetcode题目,熟练350道题2遍算是一个能凑合地应对未来的求职面试问题的数字。
重要的事情说三遍
疯狂求米中!
疯狂求米中!
疯狂求米中!
求一波大米,谢谢未来的学弟学妹们
补充内容 (2021-1-30 09:37):
别只收藏不评分呀 大大们 😭
