机器学习-泛化能力

论坛 期权论坛     
选择匿名的用户   2021-5-30 02:31   179   0
<p id="main-toc"><strong>目录</strong></p>
<p id="1.%E4%BB%80%E4%B9%88%E6%98%AF%E6%B3%9B%E5%8C%96%E8%83%BD%E5%8A%9B-toc" style="margin-left:0px;"><a href="https://blog.csdn.net/qq_41877184/article/details/113902481#1.%E4%BB%80%E4%B9%88%E6%98%AF%E6%B3%9B%E5%8C%96%E8%83%BD%E5%8A%9B">1.什么是泛化能力</a></p>
<p id="2.%E4%BB%80%E4%B9%88%E6%98%AF%E5%A5%BD%E7%9A%84%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E6%A8%A1%E5%9E%8B%E7%9A%84%E6%8F%90%E5%87%BA-toc" style="margin-left:0px;"><a href="https://blog.csdn.net/qq_41877184/article/details/113902481#2.%E4%BB%80%E4%B9%88%E6%98%AF%E5%A5%BD%E7%9A%84%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E6%A8%A1%E5%9E%8B%E7%9A%84%E6%8F%90%E5%87%BA">2.什么是好的机器学习模型的提出</a></p>
<p id="3.%E6%B3%9B%E5%8C%96%E8%AF%AF%E5%B7%AE-toc" style="margin-left:0px;"><a href="https://blog.csdn.net/qq_41877184/article/details/113902481#3.%E6%B3%9B%E5%8C%96%E8%AF%AF%E5%B7%AE">3.泛化误差</a></p>
<p id="4.%E6%A8%A1%E5%9E%8B%E6%B3%9B%E5%8C%96%E8%83%BD%E5%8A%9B%E7%9A%84%E8%AF%84%E4%BB%B7%E6%A0%87%E5%87%86%C2%A0-toc" style="margin-left:0px;"><a href="https://blog.csdn.net/qq_41877184/article/details/113902481#4.%E6%A8%A1%E5%9E%8B%E6%B3%9B%E5%8C%96%E8%83%BD%E5%8A%9B%E7%9A%84%E8%AF%84%E4%BB%B7%E6%A0%87%E5%87%86%C2%A0">4.模型泛化能力的评价标准 </a></p>
<p id="4.%E6%8F%90%E9%AB%98%E6%B3%9B%E5%8C%96%E8%83%BD%E5%8A%9B-toc" style="margin-left:0px;"><a href="https://blog.csdn.net/qq_41877184/article/details/113902481#4.%E6%8F%90%E9%AB%98%E6%B3%9B%E5%8C%96%E8%83%BD%E5%8A%9B">4.提高泛化能力</a></p>
<p id="5.%E4%B8%BE%E4%BE%8B-toc" style="margin-left:0px;"><a href="https://blog.csdn.net/qq_41877184/article/details/113902481#5.%E4%B8%BE%E4%BE%8B">5.举例</a></p>
<p id="6.%E7%9B%B8%E5%85%B3%E5%BC%95%E7%94%A8%E6%96%87%E7%8C%AE-toc" style="margin-left:0px;"><a href="https://blog.csdn.net/qq_41877184/article/details/113902481#6.%E7%9B%B8%E5%85%B3%E5%BC%95%E7%94%A8%E6%96%87%E7%8C%AE">6.相关引用文献</a></p>
<hr id="hr-toc">
<h1 id="1.%E4%BB%80%E4%B9%88%E6%98%AF%E6%B3%9B%E5%8C%96%E8%83%BD%E5%8A%9B">1.什么是泛化能力</h1>
<p>百度百科解释:机器学习算法对新鲜样本的适应能力。</p>
<p>更加具体的解释:学习到的模型对未知数据的预测能力,<span style="color:#f33b45;"><u>这个未见过的测试数据必须是和训练数据处于同一分布,不在同一分布的数据是不符合独立同分布假设的(对同一规律不同的数据集的预测能力)</u></span>。通常通过<strong>测试误差</strong>来评价学习方法的泛化能力。</p>
<p><strong>通俗&#43;形象解释:</strong><br> 就是通过数据训练学习的模型,拿到真实场景去试,这个模型到底行不行,如果达到了一定的要求和标准,它就是行,说明泛化能力好,如果表现很差,说明泛化能力就差。为了更好的理解泛化能力,这里引入三种现象,欠拟合、过拟合以及不收敛。泛化能力的本质就是反映模型有没有对客观世界做真实的刻画,还是发生了过拟合。<br> 考试成绩差的同学,有这三种可能:<br> 一、泛化能力弱,做了很多题,始终掌握不了规律,不管遇到老题新题都不会做,称作<strong>欠拟合</strong>;<br> 二、泛化能力弱,做了很多题,只会死记硬背,一到考试看到新题就蒙了,称作<strong>过拟合</strong>;<br> 三、完全不做题,考试全靠瞎蒙,称作<strong>不收敛</strong>。</p>
<p><img alt="" src="https://beijingoptbbs.oss-cn-beijing.aliyuncs.com/cs/5606289-4f4872542920fe7b73ee013647a9a769.png"></p>
<h1 id="2.%E4%BB%80%E4%B9%88%E6%98%AF%E5%A5%BD%E7%9A%84%E6%9C%BA%E5%99%A8%E5%AD%A6%E4%B9%A0%E6%A8%A1%E5%9E%8B%E7%9A%84%E6%8F%90%E5%87%BA">2.<strong>什么是好的机器学习模型的提出</strong></h1>
<p>奥卡姆的威廉是 14 世纪一位崇尚简单的修士和哲学家。 他认为科学家应该优先采用更简单(而非更复杂)的公式或理论。</p>
<p>奥卡姆剃刀定律在机器学习方面的运用如下: </p>
<blockquote>
<p>机器学习模型越简单,良好的实证结果就越有可能不仅仅基于样本的特性。</p>
</blockquote>
<p>现今,我们已将奥卡姆剃刀定律正式应用于 统计学习理论 和 计算学习理论 领域。这些领域已经形成了 泛化边界,即统计化描述模型根据以下因素泛化到新数据的能力: </p>
<ul><li> <p>模型的复杂程度</p> </li><li> <p>模型在处理训练数据方面的表现</p> </li></ul>
<p>虽然理论分析在理想化假设下可提供正式保证,但在实践中却很难应用。 机器学习速成课程则侧重于实证评估,以评判模型泛化到新数据的能力。</p>
<p>机器学习模型旨在根据以前未见过的新数据做出良好预测。 但是,如果要根据数据集构建模型,如何获得以前未见过的数据呢? 一种方法是将您的数据集分成两个子集:</p>
<ul><li> <p>训练集 - 用于训练模型的子集。</p> </li><li> <p>测试集 - 用于测试模型的子集。</p> </li></ul>
<p>一般来说,在测试集上表现是否良好是衡量能否在新数据上表现
分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:3875789
帖子:775174
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP