为什么随机变量X和Y不相关却不一定独立?

论坛 期权论坛 工作     
匿名的论坛用户   2021-1-11 11:51   26263   5
分享到 :
0 人收藏

5 个回复

正序浏览
6#
热心的小回应  16级独孤 | 2021-1-11 11:51:13 发帖IP地址来自
独立:没有关系
不相关:没有线性关系
没有关系一定也没有线性关系,但是没有线性关系不一定没有关系。
5#
热心的小回应  16级独孤 | 2021-1-11 11:51:12 发帖IP地址来自
反例其他回答已经举了很多了,给一个直观解释。
独立是说联合分布函数等于分布函数的乘积,这个等式蕴含的信息量是很大的,你知道边际分布,就知道联合分布了。
不相关是说二阶混合中心矩等于0,是一个平均值。这个等式只蕴含了一个信息。你可以想象,在只有一个混合矩确定的情况下,联合分布函数仍然有很多变动的余地。
这和方差一样分布可能不一样几乎是一个道理。
4#
热心的小回应  16级独孤 | 2021-1-11 11:51:11 发帖IP地址来自
独立的描述更加本质,它要求两个变量时时刻刻都的确不会相互影响;
而不相关则是从统计角度上,描述两个变量整体的数值表现,如果它们在整体上没有出现数值一起改变迹象,算出来的协方差为0,那么就是不相关的。但是未必两个变量之间没有相互影响。


举个形象但未必完全准确的比方:
独立:两个完全不认识的人,没有任何关联,两人之间自然不会有任何相互的影响。
不相关:通常也是两个独立没有关联的人,但也有可能是两个有地下恋情的人。你观察他们一段时间的行为表现,似乎没有发现关联,但实际上内心早已紧紧绑在了一起,只不过在装。


回到数学上,不相关只是说两个变量不线性相关,协方差为0。
协方差反映什么?
如果两个随机变量,一个变大,另一个也跟着它变大,那么协方差大于0;
如果一个变大另一个变小,那么协方差小于0。
如果统计学上算下来,一个就不跟着另一个变化,那么协方差等于0——它们俩不相关。

但是仅仅数值上的表现就能证明它们俩绝对没有相互影响吗?不,可能只是用协方差这个统计量算出来恰好是0,可能它们之间的影响体现在不易觉察的方面,比如方差。
3#
热心的小回应  16级独孤 | 2021-1-11 11:51:10 发帖IP地址来自
首先,我们假定要研究的两个随机变量是X和Y。他们的联合密度函数是f(x,y),X的边缘密度g(x),Y的边缘密度是h(y),他们的期望分别是EX和EY,方差是Var(X)和Var(Y),协方差为Cov(X,Y)=E(XY)-EXEY

然后,题主问的是随机变量X和Y不相关却不一定独立?


这里我们默认不相关指的是不线性相关,也就是协方差或者Pearson的线性相关系数为0
即Cov(X,Y)=E(XY)-EXEY=0 或者说 EXY=EXEY。
PS:一般来说,概率和统计中不加说明的使用不相关都是指线性相关系数为0。此外,相关系数不为0的情况,各式各样的说法有很多,有的人会说这两个随机变量相关,有的人会说两个随机变量之间有一定的线性关系,显得不严谨,因为xjb乱用的人太多了,总之怎么舒服怎么来,讲清楚就ok。此外楼主说的是随机变量,随机变量的独立要想严格讨论一定要在概率的框架下面,此外随机变量uncorrelated的定义就是协方差为0,请自行wiki。在统计中,独立只出现在假设中,样本本身是不能用来讨论独立性的,度量样本相关性的量很多,除了Pearson的线性相关系数,还有Kendall’s tau,Spearman‘s rho。

独立就是两个随机变量相互独立,等价于f(x,y)=g(x)h(y),即联合密度函数等于两个边缘密度的乘积。对于离散的随机变量会稍有不同,Pr(X=x,Y=y)=Pr(X=x)Pr(Y=y) for all x and y。

首先,很明确的告诉题主, 随机变量的 不相关独立 在定义上就是不等价的。
独立是不相关的充分不必要条件,即独立可以推出不相关,反之不行。

Proof:如果已知f(x,y)=g(x)h(y),
独立=>相关 证毕
下面我们看相关!=>独立
如果已知 EXY=EXEY,显然是无法推出,f(x,y)=g(x)h(y)。
我们只需要构造一个反例就可以了,
反例如下
X 是在-1,-1/2,0,1/2,1上等可能取值的随机变量,即Pr(X=?)=1/5 for all ?,E(X)=0
Y=X^2,则Pr(Y=1)=2/5,Pr(Y=1/4)=2/5,Pr(Y=0)=1/5,E(Y)=1/2
XY=X^3的分布,是在-1,-1/8,0,1/8,1上等可能取值的随机变量,即Pr(XY=?)=1/5 for all ?,E(XY)=0
E(XY)-EXEY=0
X与Y是不(线性)相关。
但是显然他们不是独立的(其实不显然,这里是要证明的,开动你们的脑筋,哈哈)
PS:给爱思考的孩子,为什么相关系数为0呢,因为X和Y是perfect的quadratic relationship,taylor展开的一阶项为0。
等我有时间再补一个连续型随机变量的例子=w=这里面有偷梁换柱的嫌疑,因为我的反例是离散情况下的,但是我想证反的是连续的情况~Update:连续的例子已经有人给出了,我可以安息了

加餐:
在某些特殊的情况下,不相关可以推出独立,这时候不相关和独立等价
1. X,Y的联合分布服从二元高斯分布
2. X,Y都是两值随机变量(Bernoulli random variable)
第一个证明上网上一搜就有,自己证也很简单。
第二个是我本科学概率论的课后习题,爱思考的孩子,加油哦~
所以我一看楼上几个拼命用bernoulli r.v. 举例子的仁兄,觉得特别可爱哦。
2#
热心的小回应  16级独孤 | 2021-1-11 11:51:09 发帖IP地址来自
为什么随机变量X和Y不相关却不一定独立? - 孙逍的回答
说的是对的,我举个更直观的例子吧

(X,Y) 均匀分布在单位元 x^2 + y^2 = 1上


X和Y的(线性)相关系数是0。为什么呢?直观来说,因为是个圆,如果你画一条线性回归的线,线的斜率是正的还是负的都不合适,因为是对称的。数学上
因为
E(X|Y) = E(Y|X) = 0
所以
E(X) = E(Y) = 0,而且
E(XY) = E[E(XY|X)] = E[X E(Y|X) ] = 0
所以
Cov(X,Y) = E(XY) - E(X)E(Y) = 0

但是X,Y 不是独立的,因为Y的取值对于X的取值分布是影响的
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:3118703
帖子:623848
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP