
作者:王帅 封面:吉江
1.标准化处理
对于神经网络算法在实操中的运用,我们通常要对数据进行标准化处理以消除数据之间的量纲关系,方便数据之间进行很好的比较。
步骤:描述—将标准化值另存为变量

打开原数据,这样我们就可以得到标准化以后的数据。限于篇幅,仅展示部分:

2.神经网络的实现
(1)步骤:分析—神经网络—多层感知器—选定因变量、因子(一般为分类变量)、协变量。
(2)分区处可以看到spss对于样本训练集和测试集的划分
spss将样本数据划分为训练样本和测试样本,比例分别为70%,30%
(3)在输出处,可以将以下选项都选上,方便后文的分析
(4)在保存处将预测值选上
以上四个步骤是主要的,其余皆为默认选项即可。
3.模型关注点
(1)处理摘要

从上图中可以看出,训练集比例为70%,测试集(检验集)比例为30%。
(2)网络信息

从这个表格中我们可以知道输入层、隐含层、输出层的基本信息。
(3)网络图
从左到右,第1列为输入层,第2列为隐含层,第3列为输出层,也即是我们想要去预测的变量。

(4)模型摘要与分类表


从模型摘要中可以看出,训练集的错误比率为16.4%,测试集的错误比率为15.8%;
从分类表中可以看出,训练集的正确率为83.6%,测试集的正确率为84.2%。
因此,神经网络模型对于样本的预测能力较强。
(5)ROC曲线图


关于ROC曲线,我们主要关注曲线下方的区域(也叫做曲线下方的面积),总面积为1,模型中0和1的区域面积都为0.7,表明模型预测能力较好。
(6)变量重要性(在实务中很重要!)


从变量重要性程度可以看出,在本次模型预测中,模型认为int_rate和loan_to_income这两个变量比较重要;employment和grade这两个变量其次,fico_score、debt_to_income、home这三个变量的重要性程度不是很明显。
以上就是神经网络算法在spss中的实现步骤以及关键信息的解读。此外,我们也可以在spss数据表格中看到我们通过神经网络算法得出的预测值,限于篇幅,仅展示部分:

注:关注公众号,回复20191202即可获取案例数据

学堂君的历史合辑:
菜鸟系列
问卷系列
线性回归
信效度分析
聚类分析
时间序列
常见问题
神经网络
多维尺度分析
C4.5算法
生存分析
正态检验
对应分析
问卷数据分析
权重赋值
判别分析
欢迎添加:
【数据分析服务】请点击菜菜帮工作室正式上线
【社群服务助手】请点击SPSS学堂会员3群招募
【加入团队】请点击招募,我们是认真的!
