实训项目利用boruta算法进行实践

论坛 期权论坛 脚本     
匿名技术用户   2020-12-27 09:40   23   0

今天利用R语言进行了特征值的选取,一开始不给力,只出了一个特征值。elo。

记录一下。

结果:
这里写图片描述

后来修改了一下代码,就成功了。

这里写图片描述

代码如下




#引入包
library(Boruta)

#读入数据
predictors <- read.csv('F:/RStudio/Boruta/character.csv', header=T)

#tag
decision <- read.csv("F:/RStudio/Boruta/regular_tag.csv",header=T)

#integrate  
NBAChara <- data.frame(predictors[1:19], decision = factor(decision[, 1]))

#boruta
set.seed(77)
Boruta.NBAChara <- Boruta(decision ~., data = NBAChara,doTrace = 2)

plot(Boruta.NBAChara)

#默认情况下,由于缺乏空间,Boruta绘图功能添加属性值到横的X轴会导致所有的属性值都无法显示。
#在这里我把属性添加到直立的X轴。
plot(Boruta.NBAChara, xlab = "", xaxt = "n")
lz<-lapply(1:ncol(Boruta.NBAChara$ImpHistory),function(i)
  Boruta.NBAChara$ImpHistory[is.finite(Boruta.NBAChara$ImpHistory[,i]),i])
names(lz) <- colnames(Boruta.NBAChara$ImpHistory)  
Labels <- sort(sapply(lz,median))
axis(side = 1,las=2,labels = names(Labels),
     at = 1:ncol(Boruta.NBAChara$ImpHistory), cex.axis = 0.7)

#蓝色的盒状图对应一个阴影属性的最小、平均和最大Z分数。
#红色、黄色和绿色的盒状图分别代表拒绝、暂定和确认属性的Z分数。

#现在我们对实验性属性进行判定。
#实验性属性将通过比较属性的Z分数中位数和最佳阴影属性的Z分数中位数被归类为确认或拒绝
final.boruta <- TentativeRoughFix(Boruta.NBAChara)
print(final.boruta)

#获取确认属性的列表
getSelectedAttributes(final.boruta, withTentative = F)

#创建一个来自Boruta最终结果的数据框架
boruta.df <-  attStats(final.boruta)


最后整理的:
这里写图片描述

得到的最终的特征属性

分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:7942463
帖子:1588486
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP