重写一下这个答案,可能表述的更清楚一些。
Statistics 统计学,应该大家都不陌生。上大学的时候,都会学一门课:概率论与数理统计。
并且这门课很有可能会分成两个学期来上。第一学期学概率论;第二学期学数理统计。
概率论部分主要是讲:大千世界中,数据的分布呈现出来的形状 (分布函数,密度函数..)。
而数理统计部分则是在讲:建立在各种分布的前提下,我们如何用少量的样本数据来推断总体的一些性质; 或者推断两个样本是否来自一个总体; 等等...
所以:
[概率论] 是 [数理统计] 的理论基础;
学[数理统计] 就等于在学习如何进行 [统计推断];
[概率论]+[数理统计] = [统计学];
学习[统计学] 的目的 就是进行[统计推断]。
所以,[统计学]和[统计推断]的关系用第一版答案的话来表述就是:
statistics 统计学是基础. statistical inference 是学统计的目的,即根据样本数据,对总体进行统计推断(假设检验 或 预测). 这两个概念都可以算属于统计学学科.
[统计学] 里,用的最多的就是回归模型,而回归模型里参数的求解,主要是通过[最小二乘(OLS)]和[最大似然估计(MLE)] 来求解。
OLS 和 MLE 其实是一个 [数值优化 (Optimization)] 的问题。
而 [数值优化] 就和机器学习联系起来了。
所谓让机器学习,其中的一个方向,就是让机器求解一个或多个 [数值优化] 的问题。 这个通过利用 [回归模型] 和 [数值优化] 来解决问题的思路就叫做 [ Statistical Learning ].
机器学习的另一个方向是 通过逻辑判断的方法来求解问题, 那个方向可以简称 [Concept Learning].
所以,[Statistical Learning] 会涉及回归模型,会涉及 OLS, MLE 或其他数值优化的方法。
这就是为什么 Learning 前面 要加一个形容词:Statistical。
机器学习里的 [Statistical Learning] 是一个求解问题的方法。
统计学里的[Statistical Inference] 是用途。
Statistical Learning 关注的是最小化预测的误差。
而 Statistical Inference 看中的是 某个参数的估计值是否(从统计学上)显著。
所以,才有了之前的答案:
statistical learning 讲的是 在machine learning 学科下, 利用统计学知识和数值型数据 来进行机器 学习 (或叫 优化). machine learning 除了 statistical learning 以外,还有其他 learning 的方法.
从概念和内容上,三者的关系是:
statistics < statistical inference < statistical learning
虽然内容和概念上有包含的关系,但是三门课研究的侧重不同。
如果想完全学好数据挖掘(中的数值方法部分) 或 实证研究的方法,最好这三个领域都看看。 |