纯文科生学习计算机语言学难度大吗?

4952
9
答主背景: 何昊天,华盛顿大学 Computational Linguistics硕士项目,本科毕业于北京语言大学对外汉语专业,现任美国苹果公司Siri语音合成工程师。

华盛顿大学初印象
华盛顿大学位于西雅图,是距离中国最近的一个美国大陆城市。作为一个特别怕热的人,我觉得西雅图环境特别好,一年四季都像春天一样。除了硅谷之外,西雅图是美国科技公司最密集的一个城市,加上现在人工智能发展非常迅速,所以就业机会特别多。


UW有一些很著名的专业是在全美排名前列的。护士护理专业、基础医疗都是全美排名第一的,理工科类专业包括计算机系都是在全美研究型的学校排名前列的。华盛顿大学是在西雅图的downtown,所以吃喝玩乐等等做什么事情很方便,这与大农村型学校形成新生的鲜明。

西雅图怎么样
如果不喜欢雨的话,你可能不会喜欢西雅图,因为西雅图有超过半年的时间都在下雨。
除了下雨没有任何槽点。生活成本低,工作机会多,收入水平高,因为华盛顿州没有周税,所以开出的工资就比其他地区高出一大截。吃喝玩乐的东西比较多,中餐、海鲜也挺多的,可以说是海鲜爱好者的天堂,almon、Alaska crab等都很多,回中国的机票也很便宜,距离也很近,只需要十个小时左右就可以回国。距离加拿大也很近,周末开车去温哥华玩只需要两个小时就到了。

我在UW学什么?


项目介绍
我就读的专业全称叫计算语言学硕士MS in Computational Linguistics,也可以叫自然语言处理,是在华盛顿大学西雅图分校语言学系下面的一个语言学和计算机交叉的跨学科专业,课程是由语言学系、计算机系和统计系等相关科系的课程共同组成的。跟UW一样,有一些学校的Computational Linguistics是在语言学系下面的。但是CMU和Stanford的Computational Linguistics是在计算机系下面的。
计算语言学是一个MS项目,没有提供PhD学位,是一个Professional Program,主要面向就业而不是偏研究型。所以是非常的技术化的一个专业,我们的就业面向就是计算语言学,或者说自然语言处理相关的一些工作。每年大概招30名学生,然后国际生的比例大概占到三分之一。我是2012年唯一一个入学的中国学生。随着现在知名度越来越响之后,现在每一届可能都有4、5名中国学生,也就是说差不多每年都有一半的国际学生是来自于中国的。
UW有一些与Computational Linguistics相关的项目,如信息学院下面的信息管理硕士项目,以及专门研究人机交互的Human Machine InteractionProgram。UW的语言学系开设有理论语言学等一些专业,但是和Computational Linguistics相关性不大。

教授情况
目前有三名专职负责该项目的教授,另外还有一些其他院系的教授参与进来授课。这三位教授的功底都很强,在业界也比较出名,他们做的分支正好是不同的方向,所以三位教授基本上是涵盖了这个领域所涉及全部的知识。一位是Stanford的博士,另一位是MIT的博士。第三位是一名华人教授Xia Fei,他论文产量相对比较多,主要研究的是Statistical Modelling,BiochemicalInformatics,Machine Translation。

课程设置
计算与计算语言学的课程设置由两大部分组成。一部分是语言学基础知识,需要掌握如语音学、句法学、Phonetic Syntax。还有一部分是计算机基础知识。因为是跨学科专业所以他们这两个专业的交叉的一些门类会有一系列课程,如ShallowLanguage Processing, Deep Language Processing等。学生可能会被要求到统计系选修一些课程,如StatisticsModel等,或者一些关于自然语言学应用的课程。研究生阶段必修的课程有:


奖学金
我当时在EE系做关于语音识别的RA。硕士申请到TA基本上是不可能的,当RA还是有机会的,但是opening不是很多,不会像PhD一样会给学生安排工作。学生需要去寻找是否有其他院系的相关研究项目,是否要求申请者有语言学背景的同时又懂计算机。

谁能申请?
我觉得申请Computational Linguistics项目,首先需要对这个领域感兴趣。我的同学基本上都是来自五花八门的领域,可以分为两大类,语言学背景和计算机背景。如果是语言学背景或者是计算机背景的人就特别匹配;其他背景的申请者如果有一些基础的计算机知识,能够通过系里组织的PlacementTest(考察计算机相关的能力,比如编程),就可以顺利就读。
没有GRE的要求,如果有GRE的话是一个加分,达到average水平就可以。托福需要至少100分以上。因为申请需要有跨学科背景,所以对GPA要求不是很高,考虑到华大本身有一个门槛,我觉得需要达到3.5以上。这个项目不是研究型的,不需要套瓷。

先修课程

不同专业的本科在读学生应该怎样满足学校对先修课程的要求:





已经毕业的学生不要担心,也可以做这些准备:


我们毕业后去了哪里?
目前Computational Linguistics可以说是最火的专业,UW在西雅图的认可度也比较高,所以毕业生百分之一百都找到了比较好的工作。再加上西雅图当地有很多高科技公司,每年都有招聘,甚至吸引了大量外地人来西雅图工作。甚至腾讯和阿里巴巴的美国总部都在西雅图,他们现在也在大量招聘自然语言处理相关专业的人。Computational Linguistics的学生毕业后都去了比如亚马逊、微软、Google、Facebook、Apple等相关的企业,做自然语言处理、Software Engineer相关的工作。有一些人计算机技术比较好,了解机器学习,可以做Data Scientist、Machine Learning Scientist;计算机基础不太好的人,也能找到比较基础的计算机和语言学交叉领域的工作,比如Language Engineer
我们毕业的最后一年,系里每天都会推送Daily Job Postings,会有很多的工作机会。每个公司的招聘流程也都不一样,大体上就是先要通过两轮或者三轮电话面试,最后进入一个全天的onsite面试。考察的内容主要是计算机基础,所以计算机基础必须扎实,要掌握Data Structure、核心算法、自然语言处理相关知识,建议多刷题。下图是美国科技公司员工的学校来源,对找工作而言,校友群体的排名比学校排名更重要,这是我在工作中的切身体会!

我工作后的感悟
我毕业已经三四年了,有一些工作中得到的体会想跟学弟学妹们分享。因为我本科学的对外汉语,高中都是文科生,可以说是纯文科的背景。我从文科转到计算机跨度还是非常大的,需要主动的去学习很多新事物。我发现把文科知识跟理科知识相结合起来,能做的事情其实是比想象中多很多。成为一个多学科的人才对以后的工作也是非常有用处的,能够结合不同学科的优势,让自己成为一个不可替代的人才。
苹果的Siri部门半年前发出了一个posting,想要招收一个语音合成方向的工程师。我们想要找一个同时具有语言学背景和计算机背景的人,但是我们一直没有找到特别合适的人选,现在计算语言处理这个领域的人才缺口是很大的。绝大部分申请者是计算机背景的,没有任何文科背景,不太符合我们的要求。公司如果同时招收一个纯计算机背景和一个纯语言背景的人,需要开两份工资,这两个人还要不断磨合沟通。显而易见对于公司来说,一个交叉背景的人才是更加好的选择。所以把文科和计算机结合可以做的事情非常多,跨专业背景的人也是很多公司最需要招收的人才。