机器学习-模型决定系数

论坛 期权论坛 脚本     
匿名技术用户   2021-1-10 04:24   472   0
决定系数

决定系数反应了y的波动有多少百分比能被x的波动所描述,即表征依变数Y的变异中有多少百分比,可由控制的自变数X来解释.

表达式:R2=SSR/SST=1-SSE/SST

其中:SST=SSR+SSE,SST(total sum of squares)为总平方和,SSR(regression sum of squares)为回归平方和,SSE(error sum of squares) 为残差平方和。

回归平方和:SSR(Sum of Squares forregression) = ESS (explained sum of squares)

残差平方和:SSE(Sum of Squares for Error) = RSS(residual sum of squares)

总离差平方和:SST(Sum of Squares fortotal) = TSS(total sum of squares)

SSE+SSR=SST RSS+ESS=TSS

意义:决定系数越大,自变量对因变量的解释程度越高,自变量引起的变动占总变动的百分比高。

相关系数

皮尔逊相关系数(Pearson Correlation Coefficient)

1)衡量两个值线性相关强度的量;

2)取值范围:[-1,1]

正向相关:>0,负向相关:<0,无相关性:=0

3)定义


决定系数与相关系数的关系

在一元线性相关情况下,决定系数是相关系数的平方。 相关系数是用来描述两个变量之间的线性关系的,但决定系数的适用范围更广,可以用于描述非线性或者有两个及两个以上自变量的相关关系。

决定系数的意义是变量A可以解释变量B方差的多少。
因此,相关系数的意义(为正的情况)就是变量A可以解释变量B标准差的多少。
更直接的解释是,由于变量A的变动,变量B增加了C,而这C中有r的比例是因为变量A的变动造成的。
举例:
比如模型中责任心对工作绩效一般有10%的预测力,也就是说决定系数是0.1。因此,推论到上述直接的解释上,也就意味着某人工作绩效量增加了C,这C中有大约32%是因为某人责任心的增加而增加的。
分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:7942463
帖子:1588486
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP