如何看待 2019 年 CS PhD 现扎堆申请且大部分为 AI 方向?未来几年 AI 泡沫会破裂吗?

论坛 期权论坛 留学     
匿名知乎用户   2019-4-13 09:39   6024   5
每年 AI 的 PhD 申请人都在增多,现在不光 CS 这样,连 ECE 都有大量顶会一作的申请人。现在的 AI 岗位在变少,而转行 AI 的人不断增多,未来几年会不会出现「毕业即失业」的现象?
分享到 :
0 人收藏

5 个回复

倒序浏览
2#
知乎可爱用户  11级专家 | 2019-4-13 09:39:58
今年刚渡过了 CS PhD 的申请狂潮(本人是14级的学生),顺便回答一下吧。
我在中国科大计算机本科期间,学生工作做的很多,认得不少13,14,15,16,17届的学生(包括少年班和物理学院),了解一些他们的一些想法。中国科大是PhD申请大户之一,因此申请倾向和数据都还算可以参考的风向标;此外计算机和信息学院本身没有特别偏重AI,因此相关的改变就直接反应了AI这几年发展带来的冲击力。13届学生是第一批开始感受到AI发展带来影响的学生,不过当时由于大数据、VR、IoT这些宣传得还挺火,13届申请方向还是挺多样性的,并没有出现全员AI的情况。到了14级,AI开始成为比较热门的方向,这在各种场合都有反映,港中文到我们这里宣传的时候也特地请了MMLab的教授(特别是科大校友),MSRA招联培生的宣讲中也越来越多的谈及Deep learning。这些很大程度上是因为14年deep learning完成了很多里程碑式的事件。不过由于科大课程设置和科研团队没有特别偏AI,导致申请AI方向的人没有预想的多。15级学生已经完全感受到了AI的冲击,几乎每个学生都知道deep learning或者相关的学术词汇,我们编译原理的老师曾经吐槽说“15级没有一个做system的了,都想搞AI”;不过到了申请季,大家都意识到AI方向竞争过于激烈,科大学生多数又不愿申请排名50开外的学校,大家反而选择避开AI的锋芒,而事实证明这个选择是理智的,今年申请AI方向确实竞争过度,而且就算不申请AI方向,CS PhD申请也够受了。2018年,科大又搞了人工智能试点学院以及大数据学院,不少学生(16级)因为当时热门就选了这个方向,现在因为发现这个方向竞争过度激烈而感到焦虑,我很担心学生间发生内卷。这些现象表明AI热潮来得如此之快,以至于大家还没有准备就已经饱和了,至少是CS PhD申请上是如此。
另外我还要谈谈在北京一家人工智能公司的经历。我在那里认得不少学生,相当大一部分来自清北,上交和华科(很多北京本科生来兼职以获取人工智能经验)。实习的一段时间内,我强烈地感受到novelty(创意,新颖性)和work(有效性)之间的矛盾。学术领域非常看中novelty,而deep learning又很容易挖坑出novelty,这也导致相当容易发论文。然而公司在试图把这些novelty用到实际中的时候,却发现几乎很难在实际中有成效。真正有效的是数据量,数据的清洁度,以及deep learning中非常少的大家都熟知的一些算法,以及满足这些算法和数据的系统平台。这是deep learning非常尴尬的一点,这也迫使很多人最终变成调参工程师。然而即便如此,大家还是愿意使用deep learning,很大一部分原因是有的时候它的实际效果确实好,而且虽然要调参,但是大家总是能够在会议发表之前调好参数,相比之下你可能无论如何调整SVM的kernel也达不到CNN的效果。另外一个常见的误解是deep learning就意味着高算力,这个不算完全正确。msra参加过ImageNet多年的成员透露说,当年的经典算法最后输了甚至很多是因为没有跑完,毕竟很多经典算法不做近似的情况下需要对整个ImageNet进行SVD,即使当今的算力也远远达不到。而进行mini-batch和分布式训练的时候,deep learning方法体现出了巨大的优势,既是算力/资源上的(想想你显卡的内存才多大,数据又有多大)也是结果上的,甚至过大的batch对deep learning反而不利。deep learning的这些奇怪性质让公司和学术界又爱又恨,既让大量的人投入研究,又觉得万一是死路一条心里一寒。
再谈谈就业的情况。这里特别说一下美国加州,因为我去访问过所以特别了解,而且我感觉国内AI圈的就业环境也在渐渐步加州地区的后尘。相比CS PhD而言,CS Master其实焦虑得多,首先是PhD数量远远少于Master(比如加州大学系统公开数据中Master数量大约是PhD的10倍)。我去参观USC的时候(对于科大而言是 CS Master 著名保底校),得到了很多非常有趣的反馈。比如他们的deep learning课程评分非常低,上课效果极差,作业难以批改,助教很少反馈,大作业非常随便,评分非常玄学,很多人都不来上课,而且即使他们来了教室门外走廊也可能站不下,但是选课的waiting list最多竟达到了大几百人,选课的主体几乎包含学校所有学院的学生(包括一些怎么也不相干的方向)。大家为什么选课呢?就是为了简历上写一句“我学过deep learning,因此我觉得我可以申请AI方向的工作”。这个现象让部分USC的 CS Master非常焦虑。由此可见AI造成巨大危机的一点是其入门门槛实在是太低了,各个领域都想分一杯羹,使得其在应用领域迅速脱离CS的指导,日益玄学化和调参化,这样一但出现致命的问题,CS界的人也没有办法救回它。而且另外一个严重问题是大量CS外的人的涌入导致工程质量遭到了很大挑战,某USC的同学向我哭诉其同组同学竟然完全不懂OOP就写大工程,最后abcd满天飞,现在出了bug要调整结构快把人逼疯了。最终AI到实际应用还是一个工程问题,然而现在硅谷充满了刷deep learning课和leetcode然后直接到公司的情况,这让AI的落地和就业模式充满了不确定因素,就怕出现重大事故城门失火殃及池鱼,最后大家不信任AI直接导致AI的研究投资断裂,进入寒冬。有趣的事,USC的Web课评价要高很多,竞争也少的多,而且上的大多是CS Master,通过了解其中不少人在赌下面AI会先在招工作方面凉凉。滑稽的是,他们不久前才收到USC本科某课程的教务通知,本科有个课程waiting list才十几,讲师就抱怨“TOOOOO LONG”了。
然而让我现在放弃AI是不可能的,因为按照行话来说,现在这里“low-hanging fruits”太多了,太多有趣的问题没有解决了,作为真的想要做研究的人很难说服自己放弃这个领域。这好像20世纪初的量子论一样,把p=hv倒一下都可能拿一个诺奖。量子论的研究高峰经历了数十年,彻底改变了人们对基础理论的认知,虽然很多相关工具(泊松括号,哈密顿量,对易子,线性代数)很多年前就被人研究过了。而深度学习为代表的从2012年以来才过了7年而已,谁都不知道未来50年会怎么样。AI的风险很多在于它太接近应用,导致人们常常高估近期的成果,而低估长久的发展。作为CS PhD而言,其实不希望这个领域过于热门的,这个虽然会带来很多资金,但是也造成了很多风险。然而现在火了是事实,所以更重要的是想好下面的大方向是什么。个人赌的是AI-system,这也是UW(TQ Chen等)和UCB(RISELab + BAIR)今年新有的方向(可能之前也有,但是我没有听说过)。当然了,看申请情况,考虑到这点的似乎不是我一个人,AI-sys的pool推测竞争异常激烈,初筛后剩下的人中录取率应该不足5%(仅仅是周边了解推测,我没有委员会的数据)。此外,尽量做自己喜欢的方向吧,我曾经差点和我的同学一起申请清华的HPC方向去了,这个领域一直不温不火,但是一想到一些很有趣的没有做的事情,心里还是很高兴的,从来无需担心这个领域的起起伏伏。
PS:本文其实也间接提示AI-system也非常可能是一个PhD申请的“刚发展就饱和”的领域,现在我也不得不承认CS PhD申请是有点内卷了(体现在你刚想到一个方向时发现别人也就都想到了)。
PS: PS: 此外,不管哪个领域,都可以在上升期做科研,在平稳期做业务,在饱和期做教育,显然Andrew Ng是个明白人。
3#
知乎可爱用户  11级专家 | 2019-4-13 09:39:59
泡沫破裂的可能性其实挺大的。
首先要明确的是现在大家看到的AI热潮几乎毫无疑问地将要深刻改变人类社会的生产方式。由这一轮技术突破带来的影响正在辐射到各行各业。泡沫破裂不是因为AI是骗局,而是因为投资过于倾斜又过于乐观导致回报可能低于预期。具体说来这轮突破的动力其实并不一定是调参,而是调参背后数据采集,数据清洁,数据处理,数据存储乃至硬件等一系列的突破。许多业内人士应该很清楚:
1. 更好的算法不一定能够好过更多的数据
2. 更多的调参不一定能够好过高质量的数据
3. 高效采集(或者生成),处理高质量,高容量的数据的能力对AI来说比调参和新算法重要
现在的热潮吸引了一波调参算法方向的申请者,然而每个调参的人背后,需要整个数据处理链条上理解AI系统需求的其他(系统,硬件,HCI等等)人来搭建整个链条。
虽然AI的红利分摊到了链条上的每一个步骤,大众媒体的宣传仅限于冰山一角的算法岗。很多没什么技术背景的资本和申请者就纷纷涌向了这一部分。所以现在的问题就是这些没有得到大量投资的其他领域能不能依然培养出足够的人才来支持这一波调参的人发挥价值。不能的话,泡沫就破裂了。
至于具体到PhD申请,那多出来的人也没什么影响,给别人做分母而已。无非多到最后逼学校看本科院校三围自动刷一轮而已,惨的是申请者,不是学校和已经上车的人。大量顶会一作的情况是不会持久的,因为大家习惯以后今后几年发文章门槛会变高的。Deep Learning这一波大家还在摸索什么样的文章是真的有创新贡献,而什么样的文章只是照猫画虎在灌水。大家且灌且珍惜啊。
顺带提一下,这一轮AI的热潮对国内的学生的影响远大于对美国本科学生的影响。总结一下原因就是国内的CS研究其实还是严重瘸腿的。理论,系统这类传统方向由于历史原因跟得上前沿的研究组相对还是少,消化不掉这么多有意向申请的人。ML这种最近的新领域国内水平高很多。两方面造成大量的学生往热门方向扎堆碰运气
从今年四大的录取来看现在AI相关领域似乎很需要大量其他背景的人才,比如AI-sys, ML theory等。这些细分领域门槛很高,都需要申请者在多个领域有很深的造诣,所以能搞的人也不多,水平够的话申请百发百中。。。
4#
知乎可爱用户  11级专家 | 2019-4-13 09:40:00
不用担心phd,phd在哪都是稀有动物。倒是硕士生可以担心一下。其实硕士生也不用担心,开发岗一投,就完事了。别老想着做AI赚大钱就好,要恰饭的嘛,会撸码就行。
说回phd,据我观察,phd招的还是少,在国内可能好养一点,在国外养phd还是贵。而且phd在入学后,会逐渐消失。转硕士的转硕士,退学的退学,转校的转校,跳楼的跳楼。真的出现在社会上的phd,数量很少。而且phd有五六年时间可以转变课题,入学时候是深度学习的phd,结果读博最后两年遗传算法又火起来了,于是赶紧光速水一篇基于深度学习的遗传算法,往简历上一挂,摇身一变遗传算法专家,找工作去了。放心,只要不死,总能赖活着。
来自一个博四的佛系学生
5#
知乎可爱用户  11级专家 | 2019-4-13 09:40:01
作为一个刚转专业申请上CS PhD AI方向的人来谈谈我的感受:
我申请的方向是NLP,在申请前我把美国actively做NLP的教授列了出来(这里定义做NLP我是看他组里的发表是不是在acl,emnlp,naacl上。是不是很活跃就看最近的发表数量…)
再看看哪些组还招人,有些老板去业界兼职了,有的明确不招人,还有休假去了…
最后剩下的top40的学校总共的选择真的少之又少… 我知道很多人申请还是看学校的,但我当时主要看的是导师,所以在申请时候清晰的知道每个老板的方向和我match的我才申。
每个组一年招1-2个,有的可能还不招人,这一算下来所谓NLP圈内的phd一年也就没几个。按照当时学姐的话就是北美一年nlp的坑就30多个。我自己是没概念,但可能学姐的意思是她看得上的组,加起来坑就30多个。当时的我听到这句话如同晴天霹雳,要知道我看小社区那申请人数不都是1000~2000人扎堆申请AI的么。
很多人说是说申请AI,其实做的只是应用一下神经网络到system上,这个叫交叉,在你申请的时候其实还是system track,面你的也是system的老师,以后混的也是system的圈,你去申请ML的岗位,别人一看你发表的会议就知道你到底是不是AI方向。
所以最后拼刺刀的战场就是NLP,CV,ML三大核心圈+speech(已经被业界碾压)。
工作:有了圈内老板的推荐,在业界找research岗还是有很大优势的。很多时候也不是你paper多就有面试,老板的推荐也很重要。再加上老板的connection,经常会有什么公司的组里缺人发邮件过来招人。当然,以后趋势还是一半research一半产品导向结合起来。泡沫是有,但离爆炸还早。泡沫最大的无人车都没事,最多最后放到半自动驾驶上去。而且dl还有很多领域可以应用上去。
最关键的是CS PhD退出机制总比别的专业好吧,再不济拿个master走人去工作也挺好,这就是把你的下限一步一步往上抬。这一轮AI大爆发,周边非CS系的全挤破头往data science靠拢,各种public policy,social science的学生来上machine learning的课,最后找工作都是说要找data science。ds的泡沫是相当大的,调查下发现ds的需求量少之又少,尤其是神经网络这种在ds方向真的是用不上。你还不如多写点什么推荐系统,异常检测的项目在简历上。


学术:我只能说太有趣了,学的东西老的不过10年前,大部分都是三年内的。这比起我之前读finance的时候看到一篇篇paper用差不多的统计方法对着不同的因素跑regression,那真是 超级开心!过了五六十年了还在用最早的那一套理论。
最让我满意的事如今学的东西通用性很强,没有局限性,你可以到处运用它,这个skill set是可以增强的(coding能力,统计能力等)。换做别的可能五年读下来只是画ppt,吹逼的能力增强了不少。
6#
知乎可爱用户  11级专家 | 2019-4-13 09:40:02
大家都在说AI泡沫的危机,我来说点正面的“如何看待”,至少是中国的情况。
作为非AI的cs phd最后一年,本科时候看到了AI从冷门到兴起,并且现在关注国内cs教学和科研,我觉得很多学生不是因为追捧热门去学AI的,想说一些我感受到的客观原因。
为什么PhD申请AI热门?因为现在大多数本科生能申请AI。
大概十年前我本科的时候,“人工智能”还是大四的课,而且被大家认为是一门比较难的课,因为“它要用到很多的高数和线代”。其实那门课的内容也没有超过Andrew Ng的公开课的内容,但是在当时“cs=编程=软件”的氛围下,除了少数想做学术的同学,普遍流行的是多找SDE的实习,计划以后做软件工程师。在这种氛围下,大多数人大一上完数分和线代就忘了,于是在一堆写代码大作业的专业课中,一门还要用到高数和线代的专业课,当然被大家认为是难的课。(不归因于学生太差)。而现在,人工智能课或实践项目成了许多学校大二甚至大一的内容,现在我本科的学校甚至有AI实践项目作为大一程序设计课大作业的现象。这么多人做AI,也终于有这么多不是打算学术的学生本科毕业还能用矩阵写个公式了(笑)。
在近10年的时间里,中国范围内开始聚集(和回国)一些AI方面做的不错的老师,mmlab的某位大佬及其学生是其中的代表,各个top学校也有一些AI的老师陆续回国。而且学生也出现了一部分靠自己做到领先的创业公司。在他们最开始探索的时候,不是资本刺激出来的。oi党都有不少同学参与了这些现在出名的公司的初创,当时就在同学之间也有觉得他们不可能成功的。在deep learning还没兴起的时候,也有同学加入mmlab的科研,但是也在deep learning还没兴起的时候就退出了。我本科期间是“读博士无用”的观点非常强烈的时候,学校经常都有前辈呼吁大家不要读博士,因为博士研究的多数都没用。
而现在,这一批老师及这一批公司,开始让大家知道了AI是什么、为什么学、怎么学。至少“科研”真的跟业界有那么一点联系了,学生终于认为微积分和线代对cs有用了,PhD也真的可以有用了。
然后呢,就去申请AI PhD了。
于是就是另一方面了,大家都说的泡沫问题,但我也有一些不同的角度。
为什么PhD申请AI太热门?因为大多数本科生现在只能申请AI。
我接触一些今年刚上大一的学生,发现他们也对研究AI感兴趣,而且不是出于就业的原因。分析了一下原因,其实是他们觉得这样的内容他们能做,他们觉得有意义。由于上面说的这批老师的努力,使得进入AI研究成了一件不那么难的事,首先本科新生容易了解到AI研究的问题,而如果想做AI,有老师带,有好的公司实习,周围有community讨论(比如小社区上这个问题),这自然是一件令人感兴趣的事。再加上业界的PR,给AI塑造了一种情怀在里面,现在的本科生都知道deep learning理论的解释是伟大的工作,而不是像以前cs学生一样喜欢拿P=?NP问题装逼了(笑)。
但是,cs里能有这么多、这么广资源的方向,在中国基本只有AI,这就是说的“只能申请AI”。有的方向连本科课程都不很普及,怎么让学生感兴趣呢?读PhD之后我觉得密码学也很有意思,但是我本科的时候根本不了解,也没有很多知识知道那是什么,所以没考虑。有时候你想做的别的方向,老师都在划水(都不是水paper那种划水,而是老师做的科研水平都到不了国际学术层面),可能老师自己的科研主要都发XX学报这样的中文刊物(不代表一定不厉害,只能说不符合想出国的学生的需求),甚至有的方向学校根本就没有老师做。而AI,至少在某些角度,中国是比较接近国际顶尖水平的。一边是本科能体验研究和改进国际最新的结果,可能能发两三篇cvpr、iccv参加国际会议交流,看到这个领域的新技术在一个一个应用到现实中,一边可能做了两年也不知道做的有什么用,也可能没有论文,哪种方向更容易让学生感兴趣?而且竞争的焦虑增加了这种倾向:你如果没有paper,比起手握一堆paper的同学,感觉自己申请学校就会低一两个档次(虽然其实未必,但是这种焦虑难以避免)。由于本科做的是AI科研经历也是,自然申请的时候也申请AI方向了。
这样下来,AI作为中国多数本科生能接触到的、资源多的、容易跟进国际科研的方向,自然成了大家容易选择的方向,而如此热门,是因为并没有多少同等资源的方向可以选择。
当然,这几个AI的条件,包括普及认知、师资、业界环境,也是资本带来的,只不过我认为大多数学生并不是因为好找工作赚钱而申AI PhD,他们还是个人兴趣选择的(当然,从上面的分析,兴趣也可能因为资本的影响而容易产生。。)。
AI热门,是因为很多学生可以选择AI;AI太热门,是因为很多学生只能选择AI。
当然过于热门会有风险,我也觉得泡沫风险很高,但目前为止,AI给中国广大cs本科学生带来了了解到科研和数理基础的重要性,带来了体验跟进世界领先的科研的机会,甚至说能看到学习科学带来的用处、计算机科学不只是开发软件,这大概也是正面意义。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:27300
帖子:5460
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP