spss神经网络_神经网络在spss中的实现

论坛 期权论坛 编程之家     
选择匿名的用户   2021-5-21 16:30   43   0

6afec6f5ab545fd43e09d6718070e122.gif

作者:王帅 封面:吉江

1.标准化处理

对于神经网络算法在实操中的运用,我们通常要对数据进行标准化处理以消除数据之间的量纲关系,方便数据之间进行很好的比较。

步骤:描述—将标准化值另存为变量

af12249da1694f488c77840aff29d23a.png

打开原数据,这样我们就可以得到标准化以后的数据。限于篇幅,仅展示部分:

fb949dc8a7c4a36f60d5994a63becda6.png

2.神经网络的实现

(1)步骤:分析—神经网络—多层感知器—选定因变量、因子(一般为分类变量)、协变量。

997eef1813599ccc261aa53f7bdef236.png

(2)分区处可以看到spss对于样本训练集和测试集的划分

7ab5954e28c7f55c5a6ff0d76e637f75.png

spss将样本数据划分为训练样本和测试样本,比例分别为70%,30%

(3)在输出处,可以将以下选项都选上,方便后文的分析

067daae9d22103781e1f7d0bbac8323c.png

(4)在保存处将预测值选上

4feba184047e37a2c163713f5b82f4ad.png

以上四个步骤是主要的,其余皆为默认选项即可。

3.模型关注点

(1)处理摘要

bc3137a745d5306af1a51d56956cac4e.png

从上图中可以看出,训练集比例为70%,测试集(检验集)比例为30%。

(2)网络信息

8ed2d7e7c897df4179bba00bf3beab76.png

从这个表格中我们可以知道输入层、隐含层、输出层的基本信息。

(3)网络图

从左到右,第1列为输入层,第2列为隐含层,第3列为输出层,也即是我们想要去预测的变量。

b16477ff2a59ce019b14116984c63c93.png

(4)模型摘要与分类表

ec85ab793f5faf69e04d1bae52ae61df.png

dfa4bf55d4bd511db4774d9fe49bce02.png

从模型摘要中可以看出,训练集的错误比率为16.4%,测试集的错误比率为15.8%;

从分类表中可以看出,训练集的正确率为83.6%,测试集的正确率为84.2%。

因此,神经网络模型对于样本的预测能力较强。

(5)ROC曲线图

14829f4ae4e9f4e23cf680a183f02617.png

26bf2812835d0c3afb33bfe3b000ae39.png

关于ROC曲线,我们主要关注曲线下方的区域(也叫做曲线下方的面积),总面积为1,模型中0和1的区域面积都为0.7,表明模型预测能力较好。

(6)变量重要性(在实务中很重要!)

198eaa38e40902cb1af0024153415f0f.png

329d29d52ab01c994a7f7f04f89950b8.png

从变量重要性程度可以看出,在本次模型预测中,模型认为int_rate和loan_to_income这两个变量比较重要;employment和grade这两个变量其次,fico_score、debt_to_income、home这三个变量的重要性程度不是很明显。

以上就是神经网络算法在spss中的实现步骤以及关键信息的解读。此外,我们也可以在spss数据表格中看到我们通过神经网络算法得出的预测值,限于篇幅,仅展示部分:

1fd65e6cd914e6fdbc5570388b48f360.png

注:关注公众号,回复20191202即可获取案例数据

6a3bca16d7215947e2a15b0cd73e32e1.png

学堂君的历史合辑:

菜鸟系列

问卷系列

线性回归

信效度分析

聚类分析

时间序列

常见问题

神经网络

多维尺度分析

C4.5算法

生存分析

正态检验

对应分析

问卷数据分析

权重赋值

判别分析

欢迎添加:

【数据分析服务】请点击菜菜帮工作室正式上线

【社群服务助手】请点击SPSS学堂会员3群招募

【加入团队】请点击招募,我们是认真的!

1365b76f14c7584c423af5fa7a32b4c6.gif

分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:3875789
帖子:775174
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP