机器学习该怎么入门?

论坛 期权论坛 期权     
匿名用户   2018-9-24 01:13   2287159   6
提示: 作者被禁止或删除 内容自动屏蔽
分享到 :
0 人收藏

6 个回复

正序浏览
6#
红色石头  3级会员 | 2018-9-24 01:13:48

在自学机器学习快两年的时间时候,今天我来谈谈对机器学习如何入门自己的理解。

1. 放弃海量资料!

没错,就是放弃海量资料!在我们想要入门机器学习的时候,往往会搜集很多资料,什么 xx学院机器学习内部资源、机器学习从入门到进阶百 G 资源、xx 人工智能教程,等等。很多时候我们拿着十几 G、几百 G 的学习资源,然后踏踏实实地放到了某云盘里存着,等着日后慢慢学习。殊不知,有 90% 的人仅仅只是搜集资料、保存资料而已,放在云盘里一年半载也忘了打开学习。躺在云盘的资料很多时候只是大多数人“以后好好学习”的自我安慰和“自我”安全感而已。而且,面对海量的学习资料,很容易陷入到一种迷茫的状态,最直接的感觉就是:天啊,有这么多东西要学!天啊,还有这么多东西没学!简单来说,就是选择越多,越容易让人陷入无从选择的困境。

所以,第一步就是要放弃海量资料,放弃你的云盘!

2. 放弃从零起步!

说到入门,很多人会想着那就要从最基础的知识开始学起!机器学习是一门融合概率论、线性代数、凸优化、计算机、神经科学等多方面的复杂技术。学好机器学习需要的理论知识很多,有些人可能基础不是特别扎实,就想着从最底层的知识开始学起,概率论、线性代数、机器学习凸优化公式推导,等等。但是这样做的坏处是比较耗时间,而且容易造成“懈怠学习”,打消学习的积极性。因为啃书本和推导公式相对来说是比较枯燥的,远不如自己搭建一个简单的回归模型更能激发自己的学习积极性。当然,不是说不需要钻研基础知识,基础理论知识非常重要!只是说,在入门的时候,最好先从顶层框架上有个系统的认识,然后再从实践到理论,有的放矢的查缺补漏机器学习知识点。从宏观到微观,从整体到细节,更有利于机器学习快速入门!而且从学习的积极性来说,也起到了“正反馈”的作用。

3. 机器学习入门学习路线

好了,谈完了机器学习入门之前的两个“放弃”之后,我就来系统介绍下红色石头整理的机器学习入门路线。

1)Andrew Ng《Machine Learning》

首先,非常推荐吴恩达(Andrew Ng)在 Coursera 上开设的机器学习入门课《Machine Learning》,授课地址是:

Machine Learning | Coursera

关于这门课的官方介绍是:本课程将广泛介绍机器学习、数据挖掘和统计模式识别。相关主题包括:(i) 监督式学习(参数和非参数算法、支持向量机、核函数和神经网络)。(ii) 无监督学习(集群、降维、推荐系统和深度学习)。(iii) 机器学习实例(偏见/方差理论;机器学习和AI领域的创新)。课程将引用很多案例和应用,您还需要学习如何在不同领域应用学习算法,例如智能机器人(感知和控制)、文本理解(网络搜索和垃圾邮件过滤)、计算机视觉、医学信息学、音频、数据库挖掘等领域。

这门课基本涵盖了机器学习的主要知识点,例如:线性回归、逻辑回归、支持向量机、神经网络、K-Means、异常检测等等。而且课程中没有复杂的公式推导和理论分析。Ng 的目的是让机器学习初学者能够快速对整个机器学习知识点有比较整体的认识,便于快速入门。

红色石头整理了这门课所有知识点的思维导图:


这门课每个知识点都会配套相应的练习题。大家可以在 Coursera 上下载,线下完成并提交。唯一的缺点可能是该习题都是基于 matlab 平台的。但是,Github 上已经有人把作业整理成为 Python 的形式了。有 .py 和 .ipynb 两种格式。

nsoojin/coursera-ml-pykaleko/CourseraML

这门课所有的视频、课件PPT、作业,红色石头都放在了百度云盘上,需要的自行领取!

链接:pan.baidu.com/s/1I3bP48

密码:bror


2)台大林轩田《机器学习基石》

台湾大学林轩田老师的《机器学习基石》课程由浅入深、内容全面,基本涵盖了机器学习领域的很多方面。其作为机器学习的入门和进阶资料非常适合。而且林老师的教学风格也很幽默风趣,总让读者在轻松愉快的氛围中掌握知识。这门课比 Ng 的《Machine Learning》稍难一些,侧重于机器学习理论知识。

首先附上这门课的主页:

Hsuan-Tien Lin > Home

课程视频在B站上可以直接观看哦~这里附上传送门:

机器学习基石(林轩田)_哔哩哔哩 (゜-゜)つロ 干杯~-bilibili

林轩田机器学习基石这门课有一个配套教材:《Learning From Data》,林轩田也是编者之一。这本书的主页为:

Learning From Data - A Short Course

红色石头整理了这门课 16 节课的精炼笔记,供大家参考:

台湾大学林轩田机器学习基石课程学习笔记1 -- The Learning Problem

台湾大学林轩田机器学习基石课程学习笔记2 -- Learning to Answer Yes/No

台湾大学林轩田机器学习基石课程学习笔记3 -- Types of Learning

台湾大学林轩田机器学习基石课程学习笔记4 -- Feasibility of Learning

台湾大学林轩田机器学习基石课程学习笔记5 -- Training versus Testing

台湾大学林轩田机器学习基石课程学习笔记6 -- Theory of Generalization

台湾大学林轩田机器学习基石课程学习笔记7 -- The VC Dimension

台湾大学林轩田机器学习基石课程学习笔记8 -- Noise and Error

台湾大学林轩田机器学习基石课程学习笔记9 -- Linear Regression

台湾大学林轩田机器学习基石课程学习笔记10 -- Logistic Regression

台湾大学林轩田机器学习基石课程学习笔记11 -- Linear Models for Classification

台湾大学林轩田机器学习基石课程学习笔记12 -- Nonlinear Transformation

台湾大学林轩田机器学习基石课程学习笔记13 -- Hazard of Overfitting

台湾大学林轩田机器学习基石课程学习笔记14 -- Regularization

台湾大学林轩田机器学习基石课程学习笔记15 -- Validation

台湾大学林轩田机器学习基石课程学习笔记16(完结) -- Three Learning Principles


《机器学习基石》的配套视频、PPT、书籍、读书笔记的pdf文件,我都放在了 Github 上:

RedstoneWill/NTU-HsuanTienLin-MachineLearning


3)台大林轩田《机器学习技法》

《机器学习技法》课程是《机器学习基石》的进阶课程。主要介绍了机器学习领域经典的一些算法,包括支持向量机、决策树、随机森林、神经网络等等。难度要略高于《机器学习基石》,具有很强的实用性。

首先附上这门课的主页:

Hsuan-Tien Lin > Home

课程视频在B站上可以直接观看哦~这里附上传送门:

机器学习技法(林轩田)_哔哩哔哩 (゜-゜)つロ 干杯~-bilibili

红色石头整理了这门课 16 节课的精炼笔记,供大家参考:

台湾大学林轩田机器学习技法课程学习笔记1 -- Linear Support Vector Machine

台湾大学林轩田机器学习技法课程学习笔记2 -- Dual Support Vector Machine

台湾大学林轩田机器学习技法课程学习笔记3 -- Kernel Support Vector Machine

台湾大学林轩田机器学习技法课程学习笔记4 -- Soft-Margin Support Vector Machine

台湾大学林轩田机器学习技法课程学习笔记5 -- Kernel Logistic Regression

台湾大学林轩田机器学习技法课程学习笔记6 -- Support Vector Regression

台湾大学林轩田机器学习技法课程学习笔记7 -- Blending and Bagging

台湾大学林轩田机器学习技法课程学习笔记8 -- Adaptive Boosting

台湾大学林轩田机器学习技法课程学习笔记9 -- Decision Tree

台湾大学林轩田机器学习技法课程学习笔记10 -- Random Forest

台湾大学林轩田机器学习技法课程学习笔记11 -- Gradient Boosted Decision Tree

台湾大学林轩田机器学习技法课程学习笔记12 -- Neural Network

台湾大学林轩田机器学习技法课程学习笔记13 -- Deep Learning

台湾大学林轩田机器学习技法课程学习笔记14 -- Radial Basis Function Network

台湾大学林轩田机器学习技法课程学习笔记15 -- Matrix Factorization

台湾大学林轩田机器学习技法课程学习笔记16(完结) -- Finale

《机器学习技法》的配套视频、PPT、书籍、读书笔记的pdf文件,我都放在了 Github 上:

RedstoneWill/NTU-HsuanTienLin-MachineLearning


4)Andrew Ng 《深度学习专项课程》

从去年 8 月份开始,AI 界大IP吴恩达在 Coursera 上开设了由 5 门课组成的深度学习专项课程,掀起了一股人工智能深度学习热潮。这里附上 deeplearning.ai 的官网:

deeplearning.ai

关于该深度学习专项课程,红色石头非常推荐!它对于理解各种算法背后的原理非常有帮助,同时提供了大量的应用场景,涉及图像、语音、自然语言理解等各方面,还提供了一些工具函数、数据集。这个系列课程是从机器学习过渡到深度学习的必备课程!

该专项课程分为五门课,每门课的读书笔记汇总:

(1). 神经网络与深度学习

  • 深度学习概述
  • 神经网络基础之逻辑回归
  • 神经网络基础之Python与向量化
  • 浅层神经网络
  • 深层神经网络
  • (2). 优化深度神经网络

  • 深度学习的实用层面
  • 优化算法
  • 超参数调试、Batch正则化和编程框架
  • (3). 构建机器学习项目

  • 机器学习策略(上)
  • 机器学习策略(下)
  • (4). 卷积神经网络CNN

  • 卷积神经网络基础
  • 深度卷积模型:案例研究
  • 目标检测
  • 人脸识别与神经风格迁移
  • (5). 序列模型

  • 循环神经网络(RNN)
  • NLP和Word Embeddings
  • 序列模型和注意力机制
  • 今年,Ng 又在斯坦福大学又开设了高质量的深度学习课程 CS230。这门课的主页是:

    CS230: Deep Learning

    这门课是 deeplearning.ai 的线上、线下综合课程。这门课采用翻转课堂的教学形式,你可以在家观看教学视频,完成深度编程作业和在线测试,然后来到课程做进一步讨论并完成项目。这门课将以一个开放式的最终项目作为结束,此过程中教学团队会提供一些帮助。

    该门课的线上部分与deeplearning.ai一致,线下部分包含了一个课程项目。目前 CS230 的项目报告与 Poster 展示都已经发布。包含多种主题,如音乐生成、情绪检测、电影情感分类、癌症检测等。

    Deep Learning - Projects

    关于CS230所有的课程资料 pdf 文件,包括最终项目等文件见云盘:

    链接:pan.baidu.com/s/1MZGYD5

    密码:356k

    4. 进阶

    基本上完成上述课程就算是入门了。接下来可以根据自己的兴趣和方向,有的放矢。例如主攻 CV 方向,可以继续学习斯坦福 CS231n 课程:

    CS231n: Convolutional Neural Networks for Visual Recognition

    如果主攻 NLP 方向可以学习斯坦福 CS224n 课程:

    CS224n: Natural Language Processing with Deep Learning

    当然,台大李宏毅的课程也很不错:

    Hung-yi Lee


    先写到这里吧!

    ----------------------------------------------------------------------------------------------

    2018.7.23 第一次更新!

    有人留言说《机器学习基石》资源链接失效了。没办法,现在云盘资源很容易被和谐。需要的请加我百度云(2y2simple),留言“基石资源”,即可。


    另外,附上 Ng 的《Machine Learning》思维导图 .xmind 文件。

    链接:pan.baidu.com/s/1ql_8pM

    密码:br1l


    关于更多机器学习、深度学习资源和干货文章,欢迎关注我的公众号:AI有道(ID:redstonewill)!共同学习,共同进步!

    5#
    量子位  3级会员 | 2018-9-24 01:13:45

    有个真心值得推荐的入门,刚刚出炉。

    而且有全球AI第一大厂Google的品质保证~

    Google今天上线了一个“机器学习速成课程”,英文简称MLCC。用他们自己的话来形容,这个课程节奏紧凑、内容实用。

    量子位觉得还有很意外的两点:它,竟然,基本可以全程中文!(包括视频)

    还不要钱~

    听完这个课程总共需要大约15小时,包含大量教学视频,还有对算法实际运用的互动直观展示,让用户可以更容易地学习和实践机器学习概念。课程共25节,还有40多项练习。

    据Google介绍,这个课程本来是工程师教育团队为自家员工开发的,也就是说,它的前身是一份内部培训资料。目前,有18000多名Googler报名参加了MLCC课程,把从课程中学到的东西用到了Google的各种产品上。

    内部培训很成功嘛,于是Google决定,把这个课程送到更多人面前。

    整个课程在此,(自行科学上网)来听来听:

    https://developers.google.com/machine-learning/crash-course/?utm_source=google-ai&utm_medium=card-image&utm_campaign=training-hub&utm_content=ml-crash-course

    (更新:有墙内版本,把谷歌网址的com改为cn, 文字内容直接可看。但是视频可能还是不能直接看。developers.google.com/m

    虽说这个课程免费向所有人开放,但实际上,想听懂还是有一些门槛的。Google在课程页面上就明确地列出了课程的前提条件:

    掌握入门级代数知识。 您应该了解变量和系数、线性方程式、函数图和直方图(熟悉对数和导数等更高级的数学概念会有帮助,但不是必需条件)。
    熟练掌握编程基础知识,并且具有一些使用 Python 进行编码的经验。 机器学习速成课程中的编程练习是通过 TensorFlow 并使用 Python 进行编码的。您无需拥有使用 TensorFlow 的任何经验,但应该能够熟练阅读和编写包含基础编程结构(例如,函数定义/调用、列表和字典、循环和条件表达式)的 Python 代码。

    这个前提,和吴恩达老师的课程其实差不多。

    那么,数学已经基本全还给老师了怎么办!Python从入门到放弃了好几次怎么办!

    Google在前提条件下边,还列出了学习这门课的准备工作,你需要恶补的知识、事先了解的工具,全都列了出来。

    这其中,包括课程涉及的数学概念,每个概念都附有Google工程师教育团队精选的教程或文档,有来自可汗学院的课程、维基百科的词条、TensorFlow和Python的官方文档等等。

    不过,这些链接到的内容都是英语的,如果需要中文版,还是要自己动手寻找。

    试听感受

    下面,是量子位带来的试听时间。

    开头已经提过了,这个课程基本可以做到全程中文。不仅是全部的文字内容有中文版本,而且所有的讲课视频,也都是中文语音,听起来毫无障碍。

    没错,即便是老外讲课,你听到的也都是中文语音。

    这个译制片般的感觉,得益于Google的AI技术。所有的中文语音,其实都是根据原音(英文)识别并翻译之后,由机器合成的中文发音念出来的。

    Google其实也明确说了:“此视频讲座的配音是使用机器学习技术生成的。”

    所以听上去,还是能感受到一点点的机器的“口音”。下面,以第一课《机器学习简介》为例。这节课的讲师,是Google机器学习总监Peter Norvig。一起听一下。

    undefined_腾讯视频

    怎么样?这个中文配音还行么?而且语速可调,上面是正常倍速,如果你嫌慢,还能调成1.5倍速、2倍速来听讲。

    量子位试了一下2倍速……一旦接受了这种设定,还是挺带感的。一起再试听一下。

    undefined_腾讯视频

    不只是语音中文。再来下《深入了解机器学习》这一节的视频,感受一下。主讲人是D.Sculley,他是一名Senior Staff Software Engineer。

    可以看到,视频中间出现的文字乃至公式,也都用中文显示了。

    当然尽信也是不可取的。上面提到了,这些中文内容,很多都是机器翻译的结果,所以其中仍然会有出错的地方。你在听课的过程中,注意分辨。

    比如《降低损失》这一讲。视频的主讲人是Cassandra Xia,应该是一位姓“夏”的华人,不过机器翻译的时候,Xia会念成“克西亚”。

    课程中遇到需要互动学习的部分,还会暂时中止。

    值得注意的是,机器在翻译她的讲课时,把其中提到的TensorFlow,翻译成了“传感器流”。可能有一部分原因是,英文语音转文字时给转成了:tensor flow。

    如果大家看到真正严重的问题,可以留言讨论,或者向Google提出。我们只是提个醒,鸡蛋里挑个骨头。

    另外很有意思的是,课程的最后部分讲到了机器学习在现实世界中的应用示例。

    其中第一节讲的是《癌症预测》。这部分视频没有大吹特吹机器学习在诊断癌症方面有多厉害,反而是讲述了一个非常有趣的案例,推荐听一下:

    undefined_腾讯视频

    Learn with Google AI

    这个课程,是Learn with Google AI项目的一部分。项目网站上有大量Google机器学习专家提供的教学资源,除了上面介绍的MLCC课程,还有21项非常实用的资料和讲座视频。

    量子位要特别(再次)隆重推荐一个超级实用(有中文版)的资源:机器学习术语表。也就是机器学习专业词典啊同学们!在页面左下角切换语言,你就获得了一份汉英双语词典。

    机器学习术语表:

    developers.google.com/m

    Learn with Google AI网站上当然还有更丰富的内容,凡是Google推出过的AI学习资源,基本上都汇总在这里了。比如Josh Gordon的入门课程视频、TensorFlow Workshops系列笔记教程、通过动手带你入门的TensorFlow Deep Playground,GCP的机器学习指南、TensorFlow文档、甚至Google在Coursera和Udacity上开设的课程,以及收购来的Kaggle竞赛,都列了出来。

    随着Google搞更多的事情,这个网站上也会列出更多的课程和资源。

    资源太多不知道从哪学起?量子位建议还是从系统的MLCC课程开始吧,或者just follow your heart~

    当然,Google还给了一个过滤器,让用户可以根据你是谁、想找什么类型的内容、关注机器学习工作的哪个环节来筛选内容。比如说量子位作为一只“好奇的猫”,就筛选出了这些内容。

    说了这么多,学习这种事你还是必须亲力亲为的。来,网址给你:

    ai.google/education/

    请自行科学上网查看

    One More Thing

    在MLCC课程中讲“机器学习简介”一节的Google机器学习总监Norvig最近还开源了一本人工智能教材的代码。

    这本书是1992年出版的Paradigms of Artificial Intelligence Programming: Case Studies in Common Lisp,开源的代码也是Lisp写的。嗯。

    代码在GitHub上发布至今已有几周,在今天的GitHub热门榜单上依然排名第7,可以说是热度不减了。

    但与天朝码农的购房热情相比,还是要输一大截:

    欢迎大家关注我们的专栏:量子位 - 知乎专栏

    诚挚招聘

    量子位正在招募编辑/记者,工作地点在北京中关村。期待有才气、有热情的同学加入我们!相关细节,请在量子位公众号(QbitAI)对话界面,回复“招聘”两个字。

    量子位 QbitAI · 头条号签约作者

    '' 追踪AI技术和产品新动态

    4#
    谢澎涛  2级吧友 | 2018-9-24 01:13:44
    机器学习用到的数学并不难,很多较难的数学(如抽象代数、微分几何)目前在ML问题上也没有用武之地。相比数学,我觉得更重要的一点是对问题和数据的insight。很多经典漂亮的模型,如HMM、CRF、LDA都是建立在良好的motivation和insight之上,数学并不是瓶颈。至于怎么培养insight 恐怕很难说,目前能做的就是多读、多想、多试。
    3#
    张松阳  3级会员 | 2018-9-24 01:13:43
    好东西不敢独享,转载一发。

    正在学习林轩田的机器学习基石和吴恩达的机器学习,感觉讲的还不错,数学基础还是蛮重要的。

    机器学习入门资源不完全汇总

    感谢贡献者: tang_Kaka_back@新浪微博

    欢迎补充指正,转载请保留原作者和原文链接。 本文是 机器学习日报的一个专题合集,欢迎订阅:请给hao@memect.com发邮件,标题"订阅机器学习日报"。

    机器学习入门资源不完全汇总基本概念

    机器学习 机器学习是近20多年兴起的一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。机器学习理论主要是设计和分析一些让计算机可以自动“学习”的算法。机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。因为学习算法中涉及了大量的统计学理论,机器学习与统计推断学联系尤为密切,也被称为统计学习理论。算法设计方面,机器学习理论关注可以实现的,行之有效的学习算法。

    下面从微观到宏观试着梳理一下机器学习的范畴:一个具体的算法,领域进一步细分,实战应用场景,与其他领域的关系。

    图1: 机器学习的例子:NLTK监督学习的工作流程图 (source: nltk.org/book/ch06.html)

    图2: 机器学习概要图 by Yaser Abu-Mostafa (Caltech) (source: Map of Machine Learning (Abu-Mostafa))

    图3: 机器学习实战:在python scikit learn 中选择机器学习算法 by Nishant Chandra (source: In pursuit of happiness!: Picking the right Machine Learning Algorithm)

    图4: 机器学习和其他学科的关系: 数据科学的地铁图 by Swami Chandrasekaran (source: Becoming a Data Scientist)

    机器学习入门资源不完全汇总入门攻略

    大致分三类: 起步体悟,实战笔记,行家导读

    机器学习入门资源不完全汇总更多攻略机器学习入门资源不完全汇总课程资源

    Tom Mitchell 和 Andrew Ng 的课都很适合入门

    机器学习入门资源不完全汇总入门课程机器学习入门资源不完全汇总2011 Tom Mitchell(CMU)机器学习

    英文原版视频与课件PDF 他的《机器学习》在很多课程上被选做教材,有中文版。

    • Decision Trees
    • Probability and Estimation
    • Naive Bayes
    • Logistic Regression
    • Linear Regression
    • Practical Issues: Feature selection,Overfitting ...
    • Graphical models: Bayes networks, EM,Mixture of Gaussians clustering ...
    • Computational Learning Theory: PAC Learning, Mistake bounds ...
    • Semi-Supervised Learning
    • Hidden Markov Models
    • Neural Networks
    • Learning Representations: PCA, Deep belief networks, ICA, CCA ...
    • Kernel Methods and SVM
    • Active Learning
    • Reinforcement Learning 以上为课程标题节选
    机器学习入门资源不完全汇总2014 Andrew Ng (Stanford)机器学习

    英文原版视频 这就是针对自学而设计的,免费还有修课认证。“老师讲的是深入浅出,不用太担心数学方面的东西。而且作业也非常适合入门者,都是设计好的程序框架,有作业指南,根据作业指南填写该完成的部分就行。”(参见白马同学的入门攻略)"推荐报名,跟着上课,做课后习题和期末考试。(因为只看不干,啥都学不会)。" (参见reyoung的建议)

    1. Introduction (Week 1)
    2. Linear Regression with One Variable (Week 1)
    3. Linear Algebra Review (Week 1, Optional)
    4. Linear Regression with Multiple Variables (Week 2)
    5. Octave Tutorial (Week 2)
    6. Logistic Regression (Week 3)
    7. Regularization (Week 3)
    8. Neural Networks: Representation (Week 4)
    9. Neural Networks: Learning (Week 5)
    10. Advice for Applying Machine Learning (Week 6)
    11. Machine Learning System Design (Week 6)
    12. Support Vector Machines (Week 7)
    13. Clustering (Week 8)
    14. Dimensionality Reduction (Week 8)
    15. Anomaly Detection (Week 9)
    16. Recommender Systems (Week 9)
    17. Large Scale Machine Learning (Week 10)
    18. Application Example: Photo OCR
    19. Conclusion
    机器学习入门资源不完全汇总进阶课程

    2013年Yaser Abu-Mostafa (Caltech) Learning from Data -- 内容更适合进阶 课程视频,课件PDF@Caltech

    1. The Learning Problem
    2. Is Learning Feasible?
    3. The Linear Model I
    4. Error and Noise
    5. Training versus Testing
    6. Theory of Generalization
    7. The VC Dimension
    8. Bias-Variance Tradeoff
    9. The Linear Model II
    10. Neural Networks
    11. Overfitting
    12. Regularization
    13. Validation
    14. Support Vector Machines
    15. Kernel Methods
    16. Radial Basis Functions
    17. Three Learning Principles
    18. Epilogue

    2014年 林軒田(国立台湾大学) 機器學習基石 (Machine Learning Foundations) -- 内容更适合进阶,華文的教學講解 课程主页

    When Can Machines Learn? [何時可以使用機器學習] The Learning Problem [機器學習問題] -- Learning to Answer Yes/No [二元分類] -- Types of Learning [各式機器學習問題] -- Feasibility of Learning [機器學習的可行性]

    Why Can Machines Learn? [為什麼機器可以學習] -- Training versus Testing [訓練與測試] -- Theory of Generalization [舉一反三的一般化理論] -- The VC Dimension [VC 維度] -- Noise and Error [雜訊一錯誤]

    How Can Machines Learn? [機器可以怎麼樣學習] -- Linear Regression [線性迴歸] -- Linear `Soft' Classification [軟性的線性分類] -- Linear Classification beyond Yes/No [二元分類以外的分類問題] -- Nonlinear Transformation [非線性轉換]

    How Can Machines Learn Better? [機器可以怎麼樣學得更好] -- Hazard of Overfitting [過度訓練的危險] -- Preventing Overfitting I: Regularization [避免過度訓練一:控制調適] -- Preventing Overfitting II: Validation [避免過度訓練二:自我檢測] -- Three Learning Principles [三個機器學習的重要原則]

    机器学习入门资源不完全汇总更多选择

    2008年Andrew Ng CS229 机器学习 -- 这组视频有些年头了,主讲人这两年也高大上了.当然基本方法没有太大变化,所以课件PDF可下载是优点。 中文字幕视频@网易公开课 | 英文版视频@youtube |课件PDF@Stanford

    第1集.机器学习的动机与应用 第2集.监督学习应用.梯度下降 第3集.欠拟合与过拟合的概念 第4集.牛顿方法 第5集.生成学习算法 第6集.朴素贝叶斯算法 第7集.最优间隔分类器问题 第8集.顺序最小优化算法 第9集.经验风险最小化 第10集.特征选择 第11集.贝叶斯统计正则化 第12集.K-means算法 第13集.高斯混合模型 第14集.主成分分析法 第15集.奇异值分解 第16集.马尔可夫决策过程 第17集.离散与维数灾难 第18集.线性二次型调节控制 第19集.微分动态规划 第20集.策略搜索

    2012年余凯(百度)张潼(Rutgers) 机器学习公开课 -- 内容更适合进阶 课程主页@百度文库课件PDF@龙星计划

    第1节Introduction to ML and review of linear algebra, probability, statistics (kai) 第2节linear model (tong) 第3节overfitting and regularization(tong) 第4节linear classification (kai) 第5节basis expansion and kernelmethods (kai) 第6节model selection and evaluation(kai) 第7节model combination (tong) 第8节boosting and bagging (tong) 第9节overview of learning theory(tong) 第10节optimization in machinelearning (tong) 第11节online learning (tong) 第12节sparsity models (tong) 第13节introduction to graphicalmodels (kai) 第14节structured learning (kai) 第15节feature learning and deeplearning (kai) 第16节transfer learning and semi supervised learning (kai) 第17节matrix factorization and recommendations (kai) 第18节learning on images (kai) 第19节learning on the web (tong)

    机器学习入门资源不完全汇总论坛网站机器学习入门资源不完全汇总中文

    我爱机器学习 我爱机器学习

    mitbbs.com/bbsdoc/DataS MITBBS- 电脑网络 - 数据科学版

    机器学习小组 果壳 > 机器学习小组

    cos.name/cn/forum/22 统计之都 统计学世界 数据挖掘和机器学习

    北邮人论坛-北邮人的温馨家园 北邮人论坛>>学术科技>>机器学习与数据挖掘

    机器学习入门资源不完全汇总英文

    josephmisiti/awesome-machine-learning · GitHub 机器学习资源大全

    Machine Learning Video Library Caltech 机器学习视频教程库,每个课题一个视频

    Analytics, Data Mining, and Data Science 数据挖掘名站

    datasciencecentral.com/ 数据科学中心网站

    机器学习入门资源不完全汇总东拉西扯

    一些好东西,入门前未必看得懂,要等学有小成时再看才能体会。

    机器学习与数据挖掘的区别

    • 机器学习关注从训练数据中学到已知属性进行预测
    • 数据挖掘侧重从数据中发现未知属性

    Dan Levin, What is the difference between statistics, machine learning, AI and data mining?

    • If there are up to 3 variables, it is statistics.
    • If the problem is NP-complete, it is machine learning.
    • If the problem is PSPACE-complete, it is AI.
    • If you don't know what is PSPACE-complete, it is data mining.

    几篇高屋建瓴的机器学习领域概论, 参见原文

    几本好书

    • 李航博士的《统计学习方法》一书前段也推荐过,给个豆瓣的链接
    2#
    LIU XIANGYU  3级会员 | 2018-9-24 01:13:42
    1#
    刘知远  3级会员 | 2018-9-24 01:13:40
    原来写过一个段子:ML派坐落美利坚合众山中,百年来武学奇才辈出,隐然成江湖第一大名门正派,门内有三套入门武功,曰:图模型加圈,神经网加层,优化目标加正则。有童谣为证:熟练ML入门功,不会作文也会诌。

    供参考,哈哈。
    您需要登录后才可以回帖 登录 | 立即注册

    本版积分规则

    积分:
    帖子:24326
    精华:1
    期权论坛 期权论坛
    发布
    内容

    下载期权论坛手机APP