【机器学习】sklearn中的回归问题性能评估方法----------图像计算常用的指标

一、前言

回归问题解决的是对具体数值的预测，比如房价预测、销量预测等等，解决回归问题的神经网络一般只有一个输出节点，这个节点的输出值就是预测值。回归模型是机器学习中很重要的一类模型，不同于常见的分类模型，回归模型的性能评价指标跟分类模型也相差很大，这里记录一下基于sklearn库计算回归模型中常用的四大评价指标主要包括：explained_variance_score、mean_absolute_error、mean_squared_error、r2_score

二、性能评估方法概述

2.1 SSE（残差平方和、和方差、误差平方和--- Sum of Squared Errors）

该统计参数计算的是拟合数据和原始数据对应点的误差的平方和，计算公式如下：

其中是真实数据，是拟合数据，>0,从这里可以看出SSE越接近于0，说明模型选择和拟合更好，数据预测也越成功。接下来的MSE和RMSE因为和SSE是同出一宗，所以效果一样。

2.2 MSE(均方差、均方误差---Mean Squared Error）

该统计参数是预测数据和原始数据对应点误差的平方和的均值，也就是SSE/n，和SSE没有太大的区别，计算公式如下：

另外我们还会经常碰到RMSE(Root Mean Squared Error)，其实就是对MSE取个根号，为均方根误差。

三、四大评价指标方法详解

3.1 explained_variance_score (可解释方差)

解释回归模型的方差得分，其值取值范围是[0,1]，越接近于1说明自变量越能解释因变量的方差变化，值越小则说明效果越差。

y_hat ：预测值， y ：真实值, var ：方差

3.1.1 什么是可解释方差

在理解“可解释方差”前，需要先了解下方差：离平均的平方距离的平均。方差很难理解，其中的一个原因是很难可视化。可解释方差并不意味着解释了方差，仅仅意味着我们可以使用一个或多个变量来比以前更准确地预测事物。

在许多模型中，如果X与Y相关，X可以说是”解释”了Y中的方差，即使X并不真正导致Y。在下面的例子中，Y的方差的80%是由于X，剩下的20%由其他的一些Error导致的。由于X与Error非相关的z-score值，路径系数等于与Y的相关系数。

3.1.2 可解释方差的可视化

如果X预测Y，那么解释的方差等于相关系数的平方。不幸的是，这只是一个公式。它无助于我们理解它的含义。也许这种可视化会有所帮助：

3.2 mean_absolute_error(平均绝对误差)

平均绝对误差（Mean Absolute Error，MAE），用于评估预测结果和真实数据集的接近程度的程度，其值越小说明拟合效果越好。平均绝对误差 （MAE）是最容易理解的回归误差指标。我们将为每个数据点计算残差，只取每个残差的绝对值，以使负残差和正残差不会被抵消。然后，我们取所有这些残差的平均值。有效地，MAE描述了残差的典型大小。 MAE优缺点：虽然平均绝对误差能够获得一个评价值，但是你并不知道这个值代表模型拟合是优还是劣，只有通过对比才能达到效果。

3.3 mean_squared_error(均方误差)-----------重点（因为经常用）

均方差（Mean squared error，MSE），该指标计算的是拟合数据和原始数据对应样本点的误差的平方和的均值，其值越小说明拟合效果越好。由于MSE与我们的目标变量的量纲不一致，为了保证量纲一致性，我们需要对MSE进行开方，即均方根误差（RMSE）：均方根误差 Root Mean Squared Error（RMSE）

均方根误差RMSE(root-mean-square error)，均方根误差亦称标准误差,它是观测值与真值偏差的平方与观测次数比值的平方根。均方根误差是用来衡量观测值同真值之间的偏差。标准误差对一组测量中的特大或特小误差反映非常敏感，所以，标准误差能够很好地反映出测量的精密度。可用标准误差作为评定这一测量过程精度的标准。

这不就是MSE开个根号么。有意义么？其实实质是一样的。只不过用于数据更好的描述。例如：要做房价预测，每平方是万元，我们预测结果也是万元。那么差值的平方单位应该是千万级别的。那我们不太好描述自己做的模型效果。我们的模型误差是多少千万？于是干脆就开个根号就好了。我们误差的结果就跟我们数据是一个级别的，可在描述模型的时候就说，我们模型的误差是多少万元。

RMSE与MAE对比：RMSE相当于L2范数，MAE相当于L1范数。次数越高，计算结果就越与较大的值有关，而忽略较小的值，所以这就是为什么RMSE针对异常值更敏感的原因（即有一个预测值与真实值相差很大，那么RMSE就会很大）。

3.4 r2_score（决定系数、R方）

判定系数，其含义是也是解释回归模型的方差得分，其值取值范围是[0,1]，越接近于1说明自变量越能解释因变量的方差变化，值越小则说明效果越差。又称为the coefficient of determination。判断的是预测模型和真实数据的拟合程度，最佳值为1，同时可为负值。如果结果是0，就说明我们的模型跟瞎猜差不多。如果结果是1。就说明我们模型无错误。如果结果是0-1之间的数，就是我们模型的好坏程度。如果结果是负数。说明我们的模型还不如瞎猜。

R方可以理解为因变量y中的变异性能能够被估计的多元回归方程解释的比例，它衡量各个自变量对因变量变动的解释程度，其取值在0与1之间，其值越接近1，则变量的解释程度就越高，其值越接近0，其解释程度就越弱。

一般来说，增加自变量的个数，回归平方和会增加，残差平方和会减少，所以R方会增大；反之，减少自变量的个数，回归平方和减少，残差平方和增加。

为了消除自变量的数目的影响，引入了调整的R方

四、代码示例讲解

4.1 explained_variance_score

#mean_absolute_error
from sklearn.metrics import mean_absolute_error
y_true=[3,0.5,2,7]
y_pred=[2.5,0.0,2,8]
print(mean_absolute_error(y_true,y_pred))

y_true=[[0.5,1],[-1,1],[7,-6]]
y_pred=[[0,2],[-1,2],[8,-5]]
print(mean_absolute_error(y_true,y_pred))
print(mean_absolute_error(y_true,y_pred,multioutput="raw_values"))
print(mean_absolute_error(y_true,y_pred,multioutput=[0.3,0.7]))

#结果
#0.5
#0.75
#[ 0.5  1. ]
#0.85

multioutput='raw_values' 给出的是每列的 MAE
multioutput=[0.3, 0.7] 给出的是加了不同权重的每列的MAE

4.2 mean_absolute_error

#mean_absolute_error
from sklearn.metrics import mean_absolute_error
y_true=[3,0.5,2,7]
y_pred=[2.5,0.0,2,8]
print(mean_absolute_error(y_true,y_pred))

y_true=[[0.5,1],[-1,1],[7,-6]]
y_pred=[[0,2],[-1,2],[8,-5]]
print(mean_absolute_error(y_true,y_pred))
print(mean_absolute_error(y_true,y_pred,multioutput="raw_values"))
print(mean_absolute_error(y_true,y_pred,multioutput=[0.3,0.7]))

#结果
#0.5
#0.75
#[ 0.5  1. ]
#0.85

4.3 mean_squared_error

#mean_squared_error
from sklearn.metrics import mean_squared_error
y_true=[3,-0.5,2,7]
y_pred=[2.5,0.0,2,8]
print(mean_squared_error(y_true,y_pred))
y_true=[[0.5,1],[-1,1],[7,-6]]
y_pred=[[0,2],[-1,2],[8,-5]]
print(mean_squared_error(y_true,y_pred))

#结果
#0.375
#0.708333333333

4.4 r2_score

#r2_score
from sklearn.metrics import r2_score
y_true=[3,-0.5,2,7]
y_pred=[2.5,0.0,2,8]
print(r2_score(y_true,y_pred))

y_true=[[0.5,1],[-1,1],[7,-6]]
y_pred=[[0,2],[-1,2],[8,-5]]
print(r2_score(y_true,y_pred,multioutput="variance_weighted"))

y_true=[[0.5,1],[-1,1],[7,-6]]
y_pred=[[0,2],[-1,2],[8,-5]]
print(r2_score(y_true,y_pred,multioutput="uniform_average"))
print(r2_score(y_true,y_pred,multioutput="raw_values"))
print(r2_score(y_true,y_pred,multioutput=[0.3,0.7]))

#结果
# 0.9486081370449679
# 0.9382566585956417
# 0.9368005266622779
# [0.96543779 0.90816327]
# 0.9253456221198156