代码之家 › 专栏 › 技术社区 › Banjo

支持向量机中特征重要性的获取

mlr svm r

Banjo · 技术社区 · 6 年前

我用带线性核的支持向量机做了一个多类(3)分类。

对于这个任务,我使用 mlr 包裹。支持向量机来自 kernlab 包裹。

library(mlr)
library(kernlab)

print(filtered_task)

Supervised task: dtm
Type: classif
Target: target_lable
Observations: 1462
Features:
   numerics     factors     ordered functionals 
        291           0           0           0 
Missings: FALSE
Has weights: FALSE
Has blocking: FALSE
Has coordinates: FALSE
Classes: 3
negative  neutral positive 
     917      309      236 
Positive class: NA

lrn = makeLearner("classif.ksvm", par.vals = list(kernel = "vanilladot"))
mod = mlr::train(lrn, train_task)

现在我想知道哪些特性在每个类中的权重最高。知道怎么去吗?

此外,对于交叉验证结果,最好能得到每个类的特征权重。

rdesc = makeResampleDesc("CV",
                         iters = 10,
                         stratify = T) 
set.seed(3)
r = resample(lrn, filtered_task, rdesc)

我知道有可能像下面这样计算特征重要性,这与蒙特卡罗迭代的交叉验证结果类似。

imp = generateFeatureImportanceData(task = train_task, 
                                    method = "permutation.importance", 
                                    learner = lrn,
                                    nmc = 10)

但是,对于这个方法,我不能得到每个类的特性重要性,而只能得到总体重要性。

library(dplyr)
library(ggplot)

imp_data = melt(imp$res[, 2:ncol(imp$res)]) 

imp_data = imp_data %>% 
  arrange(-value)

imp_data[1:10,] %>% 
  ggplot(aes(x = reorder(variable, value), y = value)) + 
  geom_bar(stat = "identity",  fill = "darkred") + 
  labs(x = "Features", y = "Permutation Importance") +
  coord_flip() +
  theme_minimal()

0 回复 | 直到 6 年前

推荐文章

Vidya Marathe · 利用支持向量机预测概率

7 年前

COCO · numpy矢量化方式更改多行数组(行可以重复)

7 年前

Abdelghani Info · 为什么使用支持向量机?

7 年前

StarSweeper · 如何为openCV支持向量机格式化数据

7 年前

MateoConLechuga · 具有大数据样本的LIBSVM

7 年前

Rudy · 在Scikit学习(Python 3)中使用新数据重新训练持久支持向量机模型

7 年前

Amutheezan · 当使用3个类时,输出对于在Scikitlearn的支持向量机中获取决策函数意味着什么

7 年前

Xavier · 将字符串数据转换为浮点数据,然后传递到支持向量机分类器

7 年前

crabcanon · Scikit学习支持向量机特征名称

7 年前

arnold_107 · 获得支持向量机的决策边界

7 年前