bootstrap方法_Stata: Bootstrap自抽样自举法

论坛 期权论坛     
选择匿名的用户   2021-5-22 18:55   82   0
<div class="._5ce-wx-style" style="font-size:16px;">
<div class="rich_media_content" id="js_content">
  <blockquote>
   <p>NEW!连享会·推文专辑:<br>Stata资源 | 数据处理 | Stata绘图 | Stata程序<br>结果输出 | 回归分析 | 时间序列 | 面板数据 | 离散数据<br>交乘调节 | DID | RDD  |  因果推断 |  SFA-TFP-DEA<br>文本分析&#43;爬虫 | 空间计量 | 学术论文 | 软件工具</p>
  </blockquote>
  <blockquote>
   <p>连享会学习群-常见问题解答汇总:<br>?  WD 主页:https://gitee.com/arlionn/WD</p>
  </blockquote>
  <blockquote>
   <p>? 连享会主页:<strong>lianxh.cn</strong></p>
  </blockquote>
  <figure style="text-align:center;">
   <img alt="b65425d3eda227d8bf7ac123c5caff90.png" src="https://beijingoptbbs.oss-cn-beijing.aliyuncs.com/cs/5606289-52cae2088032b78e83886fbb8909b7fe.png">
  </figure>
  <blockquote>
   <p>作者:吴雄(湘潭大学),童天天(中南财经政法大学)<br>Source: The Bootstrap in Stata</p>
  </blockquote>
  <hr>
  <p><strong>目录</strong></p>
  <ul><li><p>1. Bootstrap 简介</p>
    <ul><li><p>有放回抽样</p></li><li><p>标准差与标准误</p></li></ul></li><li><p>2. 编写 Bootstrap程序</p>
    <ul><li><p>2.1 Stata 范例 1:OLS 回归的 RMSE 的标准误</p></li><li><p>2.2 Stata 范例 2:采用 Bootstrap 获取  VIF 的标准误和置信区间</p></li></ul></li><li><p>3. 参考文献</p>
    <ul><li><p>Books</p></li><li><p>Bootstrap 简介</p></li><li><p>聚类标准误-Bootstrap</p></li></ul></li></ul>
  <hr>
  <h2><span style="font-weight:bold;"></span><span style="font-weight:bold;">1. Bootstrap 简介</span><span style="font-weight:bold;"></span></h2>
  <p>Bootstrap 在中文中译为「自抽样」,「自举法」,「靴带法」。若将其纯粹视为一个英文名词,它的意思是「拔靴带」—— 通过提拉鞋带,自己把自己抬起来。这听起来多少有点「力拔山兮气盖世」的项羽大英雄当年邀众人比试力量时定下的规则:坐在椅子上,双脚离地,看谁能单凭手力把椅子和自己抬起来。又或者有人传说,项羽的力量大到可以「自己拽着自己的头发就可以把自己抬离地面」(-Link-)。</p>
  <p>虽然上述都是玩笑话,但却基本上道出了 Bootstrap 的核心思想:通过从现有样本中有放回地抽样来获得更多的「样本」(由于不是真正从母体中抽出来,所以称这些二次抽样获取的样本为「经验样本」),并进而以这些「经验样本」为基础构造统计量的标准误或置信区间,以达到统计推断的目的。</p>
  <p>正儿八经的表述是这样的:Bootstrap 是一种崭新的增广样本统计方法,为解决小样本问题提供了很好的思路。它是非参数统计中一种重要的估计统计量方差进而进行区间估计的统计方法。对于回归模型:对于线性回归模型:</p>
  
  <p>可以通过多种方法来建立 Bootstrap 的数据生成过程 (DGP) 。所谓的 Bootstrap DGP 是对未知的 「真实 DGP」的一种估计。如果 Bootstrap DGP 在某种意义上接近真实的 DGP,那么由 Bootstrap DGP 生成的数据将与真实 DGP 生成的数据相似(如果已知的话)。如果是这样,则进行模拟使用 Bootstrap DGP 获得的 P 值与真实 P 值足够接近,可以进行准确的推理。</p>
  <p>Bootstrap 的基本思想是:如果 <strong>观测样本</strong> 是从母体中随机抽取的,那么它将包含母体的全部的信息,那么我们不妨就把这个观测样本视为 <strong>“总体”</strong>。可以简单地概括为:既然样本是抽出来的,那我何不从样本中再抽样。</p>
  <p>具体而言,Bootstrap 的第一步是生成一系列 Bootstrap <strong>经验样本 (Empirical Sample)</strong> (有时也被形象地称为 「伪样本」),每个样本都是初始数据的一次有放回抽样。通过对 <strong>经验样本</strong> 的计算,获得统计量的分布。例如,要进行 1000 次 Bootstrap,求平均值的置信区间,可以对每个<strong>经验样本</strong> 计算平均值。这样就获得了 1000 个平均值。对这 1000 个平均值的分位数进行计算, 即可获得置信区间。已经证明,在初始样本足够大且初始样本是从母体中随机抽取的情况下,Bootstrap 抽样能够无偏接近总体的分布。</p>
  <p>Bootstrap 的基本步骤如下:</p>
  <ul><li><strong>Step 1:</strong> 采用有放回抽样方法从原始样本中抽取一定数量的子样本。</li><li><strong>Step 2:</strong> 根据抽出的样本计算想要的统计量。</li><li><strong>Step 3:</strong> 重复前两步 K 次,得到 K 个统计量的估计值。</li><li><strong>Step 4:</strong> 根据 K 个估计值获得统计量的分布,并计算置信区间。</li></ul>
  <h3><span style="font-weight:bold;"></span><span style="font-weight:bold;">有放回抽样</span><span style="font-weight:bold;"></span></h3>
  <p>所谓 <strong>「有放回抽样」</strong> (Samping with r
分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:3875789
帖子:775174
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP