「统计学」「统计推断」「统计学习」有什么区别?

论坛 期权论坛 留学     
匿名的用户   2019-6-29 01:29   4685   4
想学些数据挖掘的东西。现在Freedman的统计学快看完了,真心是本好书,但是貌似和数据挖掘关系不大。搜资料经常会看到统计学、统计学习、统计推断,请问他们分别指什么,有什么关联和区别?
分享到 :
0 人收藏

4 个回复

倒序浏览
2#
热心的回应  16级独孤 | 2019-6-29 01:29:38 发帖IP地址来自
重写一下这个答案,可能表述的更清楚一些。

Statistics 统计学,应该大家都不陌生。上大学的时候,都会学一门课:概率论与数理统计。
并且这门课很有可能会分成两个学期来上。第一学期学概率论;第二学期学数理统计。
概率论部分主要是讲:大千世界中,数据的分布呈现出来的形状 (分布函数,密度函数..)。
而数理统计部分则是在讲:建立在各种分布的前提下,我们如何用少量的样本数据来推断总体的一些性质; 或者推断两个样本是否来自一个总体; 等等...
所以:
[概率论] 是 [数理统计] 的理论基础;
学[数理统计] 就等于在学习如何进行 [统计推断];
[概率论]+[数理统计] = [统计学];
学习[统计学] 的目的 就是进行[统计推断]。

所以,[统计学]和[统计推断]的关系用第一版答案的话来表述就是:

statistics 统计学是基础.  statistical inference 是学统计的目的,即根据样本数据,对总体进行统计推断(假设检验 或 预测).  这两个概念都可以算属于统计学学科.


[统计学] 里,用的最多的就是回归模型,而回归模型里参数的求解,主要是通过[最小二乘(OLS)]和[最大似然估计(MLE)] 来求解。

OLS 和 MLE 其实是一个 [数值优化  (Optimization)] 的问题。
而 [数值优化] 就和机器学习联系起来了。

所谓让机器学习,其中的一个方向,就是让机器求解一个或多个 [数值优化] 的问题。 这个通过利用 [回归模型] 和 [数值优化] 来解决问题的思路就叫做 [ Statistical Learning ].

机器学习的另一个方向是 通过逻辑判断的方法来求解问题, 那个方向可以简称 [Concept Learning].

所以,[Statistical Learning]  会涉及回归模型,会涉及 OLS, MLE 或其他数值优化的方法。

这就是为什么 Learning 前面 要加一个形容词:Statistical。

机器学习里的 [Statistical Learning] 是一个求解问题的方法。
统计学里的[Statistical Inference] 是用途。

Statistical Learning 关注的是最小化预测的误差。
而 Statistical Inference 看中的是 某个参数的估计值是否(从统计学上)显著。
所以,才有了之前的答案:

statistical learning 讲的是 在machine learning 学科下, 利用统计学知识和数值型数据 来进行机器 学习 (或叫 优化). machine learning 除了 statistical learning 以外,还有其他 learning 的方法.

从概念和内容上,三者的关系是:
statistics < statistical inference < statistical learning
虽然内容和概念上有包含的关系,但是三门课研究的侧重不同。
如果想完全学好数据挖掘(中的数值方法部分) 或 实证研究的方法,最好这三个领域都看看。
3#
热心的回应  16级独孤 | 2019-6-29 01:29:39 发帖IP地址来自
貌似是,统计学包括描述性统计学和统计推断。Freedman的统计学那本书把这两部分都介绍了初步的思想。统计学习是另一门学科了,属于机器学习领域,使用统计学的方法,尤其是统计推断。是对的吗?
4#
热心的回应  16级独孤 | 2019-6-29 01:29:40 发帖IP地址来自
统计学(statistics)是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。统计学主要分为描述统计学和推断统计学


统计推断,或者叫做推断统计学(statistical inference)是指统计学中研究如何根据样本数据去推断总体数量特征的方法。统计推断主要可以分为两大类:一类是参数估计问题;另一类是假设检验问题。


统计学习(statistical learning)是关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析的一门学科,也称为统计机器学习(statistical machine learning)。统计学习是概率论,统计学,信息论,计算理论,最优化理论及计算机科学等多个领域的交叉学科
5#
热心的回应  16级独孤 | 2019-6-29 01:29:41 发帖IP地址来自
统计学是一个很大的筐。
统计推断是如何用样本推总体。
统计学习。。。不要被他的名字迷惑了,我上一张图吧,看看统计学习里都有些啥。

看完之后发现,统计学习主要是为了分类。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:32080
帖子:6440
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP