机器学习-泛化能力

目录
<a href="https://blog.csdn.net/qq_41877184/article/details/113902481#1.%E4%BB%80%E4%B9%88%E6%98%AF%E6%B3%9B%E5%8C%96%E8%83%BD%E5%8A%9B">1.什么是泛化能力</a>
<a href="https://blog.csdn.net/qq_41877184/article/details/113902481#2.%E4%BB%80%E4%B9%88%E6%98%AF%E5%A5%BD%E7%9A%84%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E6%A8%A1%E5%9E%8B%E7%9A%84%E6%8F%90%E5%87%BA">2.什么是好的机器学习模型的提出</a>
<a href="https://blog.csdn.net/qq_41877184/article/details/113902481#3.%E6%B3%9B%E5%8C%96%E8%AF%AF%E5%B7%AE">3.泛化误差</a>
<a href="https://blog.csdn.net/qq_41877184/article/details/113902481#4.%E6%A8%A1%E5%9E%8B%E6%B3%9B%E5%8C%96%E8%83%BD%E5%8A%9B%E7%9A%84%E8%AF%84%E4%BB%B7%E6%A0%87%E5%87%86%C2%A0">4.模型泛化能力的评价标准 </a>
<a href="https://blog.csdn.net/qq_41877184/article/details/113902481#4.%E6%8F%90%E9%AB%98%E6%B3%9B%E5%8C%96%E8%83%BD%E5%8A%9B">4.提高泛化能力</a>
<a href="https://blog.csdn.net/qq_41877184/article/details/113902481#5.%E4%B8%BE%E4%BE%8B">5.举例</a>
<a href="https://blog.csdn.net/qq_41877184/article/details/113902481#6.%E7%9B%B8%E5%85%B3%E5%BC%95%E7%94%A8%E6%96%87%E7%8C%AE">6.相关引用文献</a>
<hr id="hr-toc">
<h1 id="1.%E4%BB%80%E4%B9%88%E6%98%AF%E6%B3%9B%E5%8C%96%E8%83%BD%E5%8A%9B">1.什么是泛化能力</h1>
百度百科解释：机器学习算法对新鲜样本的适应能力。
更加具体的解释：学习到的模型对未知数据的预测能力，这个未见过的测试数据必须是和训练数据处于同一分布,不在同一分布的数据是不符合独立同分布假设的（对同一规律不同的数据集的预测能力）。通常通过测试误差来评价学习方法的泛化能力。
通俗+形象解释： 就是通过数据训练学习的模型，拿到真实场景去试，这个模型到底行不行，如果达到了一定的要求和标准，它就是行，说明泛化能力好，如果表现很差，说明泛化能力就差。为了更好的理解泛化能力，这里引入三种现象，欠拟合、过拟合以及不收敛。泛化能力的本质就是反映模型有没有对客观世界做真实的刻画，还是发生了过拟合。 考试成绩差的同学，有这三种可能： 一、泛化能力弱，做了很多题，始终掌握不了规律，不管遇到老题新题都不会做，称作欠拟合； 二、泛化能力弱，做了很多题，只会死记硬背，一到考试看到新题就蒙了，称作过拟合； 三、完全不做题，考试全靠瞎蒙，称作不收敛。
<img alt="" src="https://beijingoptbbs.oss-cn-beijing.aliyuncs.com/cs/5606289-4f4872542920fe7b73ee013647a9a769.png">
<h1 id="2.%E4%BB%80%E4%B9%88%E6%98%AF%E5%A5%BD%E7%9A%84%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E6%A8%A1%E5%9E%8B%E7%9A%84%E6%8F%90%E5%87%BA">2.什么是好的机器学习模型的提出</h1>
奥卡姆的威廉是 14 世纪一位崇尚简单的修士和哲学家。他认为科学家应该优先采用更简单（而非更复杂）的公式或理论。
奥卡姆剃刀定律在机器学习方面的运用如下： 
<blockquote>
机器学习模型越简单，良好的实证结果就越有可能不仅仅基于样本的特性。
</blockquote>
现今，我们已将奥卡姆剃刀定律正式应用于统计学习理论和计算学习理论领域。这些领域已经形成了泛化边界，即统计化描述模型根据以下因素泛化到新数据的能力： 
<ul><li> 模型的复杂程度 </li><li> 模型在处理训练数据方面的表现 </li></ul>
虽然理论分析在理想化假设下可提供正式保证，但在实践中却很难应用。机器学习速成课程则侧重于实证评估，以评判模型泛化到新数据的能力。
机器学习模型旨在根据以前未见过的新数据做出良好预测。但是，如果要根据数据集构建模型，如何获得以前未见过的数据呢？一种方法是将您的数据集分成两个子集：
<ul><li> 训练集 - 用于训练模型的子集。 </li><li> 测试集 - 用于测试模型的子集。 </li></ul>
一般来说，在测试集上表现是否良好是衡量能否在新数据上表现

机器学习-泛化能力

浏览过的版块