解读Beta 分布、二项分布,结合CancerLocator

论坛 期权论坛     
选择匿名的用户   2021-5-23 01:16   20   0
<p>投一枚硬币四次,两次正面,两次背面,问:投这枚硬币正面的概率 P 是多少?</p>
<p>        答:0.5</p>
<p>        错</p>
<p>错误的原因有两个可能。</p>
<ol><li>我们有一个先入为主的概念,认为硬币就是正反面的,所以就应该是正反面平均一下。</li><li>我们根据实验的结论,2/4 &#61; 0.5, 所以硬币是正面的概率是0.5。</li></ol>
<p>上面的两种错误相互对立,历史告诉我们,将两种对立的错误加以整合,往往就能得到一个超级自然,超级好的结果。在这个问题上的整合,叫做<a href="https://zh.wikipedia.org/wiki/%E8%B4%9D%E5%8F%B6%E6%96%AF%E6%8E%A8%E6%96%AD">贝叶斯推断</a>。</p>
<p>贝叶斯推断(Bayesian inference)的公式非常简单</p>
<p style="text-indent:0;"><img alt="{\displaystyle P(H\mid E)&#61;{\frac {P(E\mid H)}{P(E)}}\cdot P(H)}" class="blockcode" src="https://beijingoptbbs.oss-cn-beijing.aliyuncs.com/cs/5606289-8e1c6f22a453a302cb188754cc59fb73"></p>
<p><img alt="{\displaystyle \textstyle P(H)}" class="blockcode" src="https://beijingoptbbs.oss-cn-beijing.aliyuncs.com/cs/5606289-05419d627554e4952221986ca8e3f86d">叫<a href="https://zh.wikipedia.org/wiki/%E5%85%88%E9%AA%8C%E6%A6%82%E7%8E%87">先验概率</a>,是观察到数据<img alt="{\displaystyle \textstyle E}" class="blockcode" src="https://beijingoptbbs.oss-cn-beijing.aliyuncs.com/cs/5606289-95f1727580780829431b3f9c1c4c4d6e">(目前证据)之前,假说<img alt="{\displaystyle \textstyle H}" class="blockcode" src="https://beijingoptbbs.oss-cn-beijing.aliyuncs.com/cs/5606289-b153de7a4f68393c5636fabbcc0c6284">的机率。</p>
<p><img alt="{\displaystyle \textstyle P(H\mid E)}" class="blockcode" src="https://beijingoptbbs.oss-cn-beijing.aliyuncs.com/cs/5606289-cdcc414daf6f6aa18ea391ad2f601f43">叫<a href="https://zh.wikipedia.org/wiki/%E5%90%8E%E9%AA%8C%E6%A6%82%E7%8E%87">后验概率</a>,是在给定证据<img alt="{\displaystyle \textstyle E}" class="blockcode" src="https://beijingoptbbs.oss-cn-beijing.aliyuncs.com/cs/5606289-95f1727580780829431b3f9c1c4c4d6e">之后,假说<img alt="{\displaystyle \textstyle H}" class="blockcode" src="https://beijingoptbbs.oss-cn-beijing.aliyuncs.com/cs/5606289-b153de7a4f68393c5636fabbcc0c6284">的机率。</p>
<p>其中系数<img alt="{\displaystyle \textstyle {\frac {P(E\mid H)}{P(E)}}}" class="blockcode" src="https://beijingoptbbs.oss-cn-beijing.aliyuncs.com/cs/5606289-6487255d1ff2222a7d2146caf659edb2">可以解释成<img alt="E" class="blockcode" src="https://beijingoptbbs.oss-cn-beijing.aliyuncs.com/cs/5606289-ec6dde64df37a093e37244e73aee5750">对<img alt="H" class="blockcode" src="https://beijingoptbbs.oss-cn-beijing.aliyuncs.com/cs/5606289-05634628579a120f40291036722e1e1a">机率的影响。</p>
<p>这个公式将信息与人们的认知联系在了一起,阐明了实验对人们认知的变化的影响。H就是人们先有的概念,E是实验的数据,H|E是在有了数据之后人们对这件事的判断。</p>
<hr>
<p>小学三年级的课本上写的就是上面的内容。当我们进入了四年级,我们摆脱了数自然数:0,1,2,3,4……的阶段,我们一次次的把数轴补齐,我们开始有了连续的概念,极限的概念,积分的概念。在这些概念下,我们对 “概率” 这个概念有新的想法,它可能不是一个单纯的一个数,可能是一个“函数”,或者。。。<a href="https://zh.wikipedia.org/wiki/%E5%88%86%E5%B8%83_%28%E6%95%B0%E5%AD%A6%E5%88%86%E6%9E%90%29">分布</a>?!</p>
<p>分布:可以从字面理解一下,你比方说人口分布,那就是讲,这个地方哪人多,哪人少。然后这个分布还和量子力学相关,量子力学说不清这个粒子的具体位置,物理学家觉得粒子是一团概率分布,这团概率积分是连续的,可积分的。同样部分概率论学者认为一件事情的概率并不是一个确定的数值,而是一个分布,一个可积分的函数。</p>
<p>好了,明白了分布的意思。我们就觉得,影响一个事件的参数应该不可能被我们完全的确定下来,我们能做到的仅仅是描述他的参数的分布情况,我们定义一个问题的参数是<img alt="\theta" class="mathcode" src="https://beijingoptbbs.oss-cn-beijing.aliyuncs.com/cs/5606289-798a135f47a1ec3dc636082b66dc9938.latex">,这个参数的分布是<img alt="p(\theta )" class="mathcode" src="https://beijingoptbbs.oss-cn-beijing.aliyuncs.com/cs/5606289-749a02d021ea68d56e9740d3e03e2b3e.latex"></p>
<p>下面是关于<img alt="\theta" class="mathcode" src="https://beijingoptbbs.oss-cn-beijing.aliyuncs.com/cs/5606289-798a135f47a1ec3dc636082b66dc9938.latex">的贝叶斯推论的公式,他的变量是<img alt="\theta" class="mathcode" src="https://beijingoptbbs.oss-cn-beijing.aliyuncs.com/cs/5606289-798a135f47a1ec3dc636082b66dc9938.latex">。</p>
<p><img alt="{\displaystyle p(\theta \mid \mathbf {X} ,\alpha )&#61;{\frac {p(\mathbf {X} \mid \theta )p(\theta \mid \alpha )}{p(\mathbf {X} \mid \alpha )}}\propto p(\mathbf {
分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:3875789
帖子:775174
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP