随机变量的独立性和相关性有什么联系?相关系数为零能说明什么?

论坛 期权论坛 期权     
热心用户   2019-5-18 03:48   13038   5
我知道相关系数为零并不能说明两个随机变量独立,但是能说明什么问题呢?
分享到 :
0 人收藏

5 个回复

正序浏览
6#
zhihu用户  16级独孤 | 2019-5-18 03:48:21
补充楼上回答 相关系数为0是两变量独立的必要非充分条件
The property of Covariance:
If X and Y are independent, then
Cov[X,Y] = 0
However, the converse statement maybe wrong, i.e.
If Cov[X,Y] = 0, X and Y may be dependent.
举个反例【不独立且不相关】:
Suppose RV X follows
, and RV Y satisfy
.

However, X and Y are not independent, since
5#
zhihu用户  16级独孤 | 2019-5-18 03:48:20
相关关系一般是由相关系数来度量。而相关系数本身所描述的是两个随机变量之间的线性拟合程度(具体公式楼上做了很好工作)。相关系数等于1与两个随机变量之间存在线性关系二者之间是充分必要关系。
但是,两个随机变量之间如果是平方关系,相关系数会为0.这意味着二者之间没有线性关系,并不是说二者之间没有关系。毕竟,知道一个随机变量的取值,另一个值也可以通过平方关系计算出来。感觉与泰勒展开的线性部分有点瓜葛,具体有兴趣的话可以尝试着推演。
相关性出现的场景:
线性回归模型里面的相关系数与偏相关系数。
内生性原因之一:解释变量与扰动项相关。
线性回归模型解释变量之间的多重共线性与相关性之区别。
最后,可以考虑线性模型为什么在大多数情况下是够用的?为什么在大多数情况下线性模型本身就能够说明问题,并不需要变量之间的具体函数关系?线性模型设定说明什么问题,真实的函数关系还是变量之间的相关关系?
关于线性回归模型所刻画的对象,在此提一些拙见,抛砖引玉。
那二元线性回归模型来说,两个随机变量之间的关系一楼的图例画的很清楚:两个随机变量在二维坐标系上的真实描点。线性回归模型刻画的是其中的线性成分。例如:坐标系上的椭圆“关系”中构建(抽象)出存在于其中的线性关系。换言之,存在于真实关系中的线性关系本身才是线性回归模型所关心并刻画的对象。
肯定有人会问,从真实关系(椭圆)中抽象出来的线性关系成分有什么用?为什么不直接去刻画真实的关系?关于这一点 @慧航做了很好的回答。
关注可从真实关系中抽象出的线性关系,用另一种说法,关注线性拟合或者拟合出的线性关系,可能才是线性回归的本质。
如何基于真实关系构建线性关系?一般的方法的是取平均,这一思想进一步发展为最小二乘(这一段历史很有趣)。但是,如果是圆盘关系,那么,最小二乘没有唯一解,这意味着基于圆盘这一真实关系通过最小二乘标准可以获得不止一条线性关系。
能否可以从真实关系中构建出线性关系?例如圆盘、二次方关系等等。如果没有线性关系成分是否可以进行线性关系设定?有兴趣的话可以自行讨论模型设定错误的后果。
4#
zhihu用户  16级独孤 | 2019-5-18 03:48:19
随机变量的独立,表明两变量相关性为0,x并不会随着y的变化而变化。平时常说的相关系数,一般指线性相关系数,为0表示两变量没有线性相关性,但有可能有非线性相关。
具体的论述可以参看下面的截图:

原文链接:  [量化学堂-数学知识]相关关系
3#
zhihu用户  16级独孤 | 2019-5-18 03:48:18
以二元为例。两个随机变量x和y之间的关系:
1. 独立:即x和y没有关系
x取什么值,对y的取值丝毫不产生影响,反之也成立。
2. 不独立:即x和y有关系f(x,y)=0,暂且表示成y=f(x)
2.1. 线性关系,即映射f是线性映射,即满足(1) f(a+b)=f(a)+f(b) (2) f(ca)=cf(a)。
    统计模型中存在随机扰动项e,即y=f(x)+e。相关系数这个指标,是在假定映射关系f是线性映射时,反映一组样本(x,y)线性关系f的确定性,或信噪(比)。
2.2. 其它关系,即映射f非线性映射,意味着x和y仍然存在某种映射关系,或在几何上讲,存在某种模式(pattern),但这种映射或模式均不为线性关系。

多元以此类推。

综上,
1. 统计学上常指的“相关性”通常是指“线性相关性”,与独立性并非对立互补
2. 相关系数衡量一组样本(x,y)线性关系f的确定性,或信噪(比)。
3. 相关系数为零说明随机变量之间没有确定的线性关系,但并不意味着随机变量之间没有更为复杂的关系,所以相关系数为零不意味着变量间独立。
2#
zhihu用户  16级独孤 | 2019-5-18 03:48:17
相关系数为0是两变量独立的必要非充分条件。相关系数反映的是两变量间的线性关系,但是变量间除了线性关系还有其它关系,这时候相关系数就不能作为一种度量了。

第一行,X,Y坐标展现的点图线性越强,相关系数绝对值更大。
第二行,更加明显。
第三行,非线性相关但显然X,Y是不独立的。

或者:假设x从-1到1,y=x^2,相关系数为0但是非独立。
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:64547
帖子:12910
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP