研究生期间想读数据挖掘,分析类的,读统计好一些还是计算机好一些,如人大的统计,或者中科院的计算机类?

论坛 期权论坛 留学     
匿名的用户   2019-6-29 01:29   3953   4
分享到 :
0 人收藏

4 个回复

倒序浏览
2#
热心的回应  16级独孤 | 2019-6-29 01:29:39 发帖IP地址来自
计算机,dm方向
3#
热心的回应  16级独孤 | 2019-6-29 01:29:40 发帖IP地址来自
先说答案:毕业后打算做实务的话,建议读计算机专业机器学习方向,做科研的话,两者皆可,但计算机的发展空间更大、机会更多。
理由一:机器学习对数据的认识和理解比统计学要深刻一些。统计原来对于认识和理解数据的本质而言的确很重要,从机器学习很长时间一直被称为“统计学习”就可略见一斑,而且像迈克尔 I.乔丹这样的机器学习超级大牛同时也是统计学大牛,他还同时在UC Berkeley计算机系和统计系任教…,这些情况都说明原来统计学对机器学习的重大影响。
但是,基于神经科学与信息处理工程学的深度学习技术取得突破性进展后,人们对分析方法与数据之间的关系有了全新的认识,统计学不再是认识数据的唯一视角,甚至在某种意义上讲,对于理解数据而言,统计学视角是一种泛化水平过低的“有害”视角。这就不难理解,为何迈克尔 I.乔丹的高足吴恩达( Andrew Ng)会背叛师门的贝叶斯学派(主要是概率图模型),博士毕业后直接投入到了联结主义学派阵营,成为深度学习的代表人物之一——这实在是很不可思议的,要知道吴恩达当年可是和他师兄Blei合作发表过LDA开山之作的牛人,他对于像基于超参数之狄利克雷分布进行统计建模这样的复杂统计技术相当精通。
机器学习的哲学基础是信息论,个人认为这个知识体系的确需要概率论,但并不必需统计学知识(而Yann Lecun更极端,最近宣称甚至连概率论对机器学习来说都没有多大意义,详见:Yann LeCun说是时候放弃概率论了,因果关系才是理解世界的基石)。一直致力于工程应用的深度学习,其泛化能力就高于统计学,目前一些统计学家也承认,统计模型长于解释而短于预测。

理由二:与统计学只关注模型不同,机器学习既关注模型,也关注算法。对于追求实效而言,算法其实比统计模型更重要,因为统计模型一般不考虑计算代价(包括计算时间、存储空间),而算法追求最优计算代价。可以说,正是算法,让统计模型得以落地实施,也表明机器学习必然是一门典型的工程学,并非一项不考虑现有基础设施条件制约、天马行空的科学探索。(对于统计学发展中面临的挑战,《女士品茶》一书有深刻认识。)

综上所述,如果追求实用的话,建议读计算机科学-数据挖掘/机器学习方向。当然,我个人认为多掌握一些统计知识还是很好的,可以让你理解机器学习的视角更加丰富。但是,这完全可以自学,可以重点掌握“随机过程”、“概率论与数理统计”、“多元统计学”,没必要专门攻读一个学位,因为与你投入到时间、精力相比,性价比不是很高,要知道统计学学起来也是很难的,反正都难,为什么不学更实用的计算机呢?当然,有志于科研的又另当别论。此外,运筹学尤其是“凸优化”、数值最优化要重点掌握,矩阵代数要滚瓜烂熟。认知心理学尤其是认知科学也非常重要,现在机器学习中的主流流派(联结主义和符号主义甚至贝叶斯主义)都深受认知科学影响,在认识论方面本质是模拟人脑运作机制的(尽管对人脑生理性的神经网络模拟并不多),需要深入学习。
4#
热心的回应  16级独孤 | 2019-6-29 01:29:41 发帖IP地址来自
如果是想做数据挖掘类或者机器学习类的工作,建议去读cs的硕士学位。
5#
热心的回应  16级独孤 | 2019-6-29 01:29:42 发帖IP地址来自
欢迎报考南京大学LAMDA组
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:32080
帖子:6440
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP