怎么来理解伽玛(gamma)分布?

论坛 期权论坛 期权     
匿名的论坛用户   2021-1-3 19:05   10416   6
参数有点多,又有积分,公式上看起来挺复杂的,地位上为什么这么重要,有哪些实用的方面,怎样可以方便理解?
分享到 :
0 人收藏

6 个回复

正序浏览
7#
热心的小回应  16级独孤 | 2021-1-3 19:05:47
需要理解?alpha (一般为整数)代表一件事发生的次数;beta代表它发生一次的概率(或者叫速率)。那么gamma 分布就代表这么一件事发生alpha 次所需要时间的分布。
例如alpha=1 就是指数分布
6#
热心的小回应  16级独孤 | 2021-1-3 19:05:46
推荐一本书
Random Phenomena: Fundamentals of Probability and Statistics for Engineers
在我读本科的时候,这本书的作者正好来我们学校交流,我上了他开的暑期课,感觉收获挺多的。

这本书里关于各种分布背后的来源/应用,我觉得是讲得不错的。拿题主问的Gamma分布来说, @T Yuan的回答给出了和泊松过程、指数分布的关系,以及详细的数学推导,这里不再重复。书上(9.1.2节)给了几个例子帮助直觉上的理解,其中一个是:
冗余系统(standby redundant system)
假设有一个系统有
个部件,但实际需要的只有一个(其余的是备用)。当一个部件失效时,另一个自动接管。因此,只有当所有
个部件都失效时,系统才会崩溃。在一定假设下,Gamma分布可以用来描述这样一个系统的寿命。

我记得当时课上老师还调侃说,发paper要经历和审稿人来回交流的过程,也许发paper的总审稿时间也可以用Gamma分布来描述。
5#
热心的小回应  16级独孤 | 2021-1-3 19:05:45
从熵最大化的角度来看,如果一个事物既满足算术平均值是固定值
,又满足几何平均值是固定值
的,这种分布最可能的分布为
分布。
也就是说,
分布可以用来模拟我们经常用来作为思想实验的事物,总数是不变的同时,其增长率也是固定的。这种事物是不存在的,但是我们可以给出他存在的概率。这种思考问题的方式确实真实存在,例如我们经常讲人民币每年升值20%,均衡汇率为6.5。例如风速,我们也可以认为其总量是不变的,同时增速也是固定的。但是我们必须要注意,因为
分布更多的用来描述汇率、速率这样的变量,所以他是没有量纲的量,也就是说与正态分布最大的不同,2X就是2倍风速的意思,不能是改变单位的意思。
4#
热心的小回应  16级独孤 | 2021-1-3 19:05:44
伽玛分布一般和指数分布一起理解:
1、从意义来看:指数分布解决的问题是“要等到一个随机事件发生,需要经历多久时间”,伽玛分布解决的问题是“要等到n个随机事件都发生,需要经历多久时间”。
所以,伽玛分布可以看作是n个指数分布的独立随机变量的加总,即,n个Exponential(λ)random variables--->Gamma(n,λ)
2、从公式来看:
XGamma(α,λ),概率公式如下

alpha代表上述的n, 当alpha=1时,就变成了指数分布:

3、从统计指标来看:

这就是 n(alpha)倍的指数分布的期望啊!
这样就好记多了吧?
------------------------------------------------------
补充一下:
如果想更好地理解,还可以加入泊松分布,泊松分布解决的是“在特定时间里发生n个事件的机率”。所以可以脑洞大开地想:伽玛分布=指数分布*泊松分布。看看pdf的表达式,自己换一个写法就会发现伽玛把exponential和poisson的公式揉到一起了。
3#
热心的小回应  16级独孤 | 2021-1-3 19:05:43
其实你只要记住了Gamma function
做积分变换
,可得
,从而

那么Gamma distribution 就很好记了。

并且伽马分布与一大坨分布有着暧昧的关系,比如:
Erlang distributionChi-squared distributionExponential distributionBeta distributionNormal distribution

最后来个分布族谱图:

2#
热心的小回应  16级独孤 | 2021-1-3 19:05:42
Gamma分布即为多个独立且相同分布(iid)的指数分布变量的和的分布。
(最新修改,希望能够行文布局更有逻辑)

——————泊松过程——————
指数分布泊松分布的关系十分密切,是统计学中应用极大的两种分布。
其中泊松过程是一个显著应用。

泊松过程是一个计数过程,通常用于模拟一个(非连续)事件在连续时间中发生的次数。

为一个泊松过程,则其满足三个性质:

(t=0时什么都没发生)


(增量)之间互相独立:
扩展补充:

互相独立,且在计数过程中


这是因为






根据增量独立性,易知其成立。

——————泊松→指数——————
假设
为第
次事件与第
次事件的间隔时间。

所以


所以

即泊松过程的事件间隔时间为指数分布。

——————指数→Gamma—————
再令
,即从头开始到第
次事件的发生的时间,该随机变量分布即为Gamma分布。


Gamma分布即为多个独立且相同分布(iid)的指数分布变量的和的分布。

——————证明——————
假设
且互相独立

①Moment Generating Function(MGF):
MGF的定义为

其性质为

下证:



为Gamma分布的MGF。
MGF:Moment-generating function

②数学归纳法:
已知
所以当
时成立。
假设

成立

时,

其中







的pdf。证毕。

当然,Gamma分布与Beta,Chi-square分布也有着十分紧密的联系,不过在统计学应用中都不如与指数分布的联系来得重要。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:3118703
帖子:623848
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP