代码之家 › 专栏 › 技术社区 › Steve

R中包含百分比的分类变量表

tibble data.table dplyr r

Steve · 技术社区 · 7 年前

我有一系列分类变量,它们有响应选项(有利、不利、中性)。

我想在R中创建一个表,该表将给出所有10个变量的行列表(每行一个变量),列中的百分比响应为“有利、不利、中性”。这在R中可能吗?理想情况下,我还希望能够通过另一个分类变量将其分组(例如,比较男性与女性对问题的不同反应)。

2 回复 | 直到 7 年前

lefft 7 年前

如果您提供实际数据的样本,您会得到更好的答案(请参阅 this post ). 也就是说,这里有一个使用 dplyr:: (和 reshape2::melt ).

# function to create a column of fake data 
make_var <- function(n=100) sample(c("good","bad","ugly"), size=n, replace=TRUE)

# put ten of them together 
dat <- as.data.frame(replicate(10, make_var()), stringsAsFactors=FALSE) 

library("dplyr")

# then reshape to long format, group, and summarize -- 
dat %>% reshape2::melt(NULL) %>% group_by(variable) %>% summarize(
    good_pct = (sum(value=="good") / length(value)) * 100, 
    bad_pct = (sum(value=="bad") / length(value)) * 100, 
    ugly_pct = (sum(value=="ugly") / length(value)) * 100
)

请注意,要按另一列(例如性别)分组,您可以说 group_by(variable, sex) 在总结之前(只要 sex 是一列数据,但在这个构造的示例中并非如此)。

-1

Marius 7 年前

适应 lefft 的示例,但尝试在 dplyr :

dat %>% 
    gather(variable, value) %>%
    group_by(variable) %>%
    count(value) %>%
    mutate(pct = n / sum(n) * 100) %>%
    select(-n) %>%
    spread(value, pct)

推荐文章

Marco_CH · 根据动态相关的两个条件进行筛选

3 年前

Shubham · 如何在R中查找数据表的两个多类别列之间的差异/setdiff()

3 年前

mt1022 · 分组数据时的不同结果。以不同方式使用数字索引的表列

7 年前

shy zhan · 如何改变数据。有很多列的表?

7 年前

Brent Pease · 查找条件语句的最小值,其中条件也适用于之后的所有值

7 年前

Serhii · 标记数据中按组随机选择的N行。桌子

7 年前

T.Beil · 在数据表中选取均匀分布的样本

7 年前

89_Simple · 为每个组运行函数

7 年前

IceCreamToucan · 选择要保留/放入数据的组。桌子

7 年前

Valeria Lobos Ossandón · 使用R查找数据帧中其他数据帧的元素位置

7 年前