二进制因子和标签(带ggplot)的利用率r堆叠百分比条形图(R stacked percentag

2019-06-18 02:54发布

我想制作一个图形,看起来是这样的:

我的原始数据集看起来是这样的:

> bb[sample(nrow(bb), 20), ]
      IMG QUANT FIX
25663   1     1   0
7936    2     2   0
23586   3     2   0
23017   2     2   1
31363   1     3   1
7886    2     2   0
23819   3     3   1
29838   2     2   1
8169    2     3   1
9870    2     3   0
31440   2     1   0
35564   3     1   0
24066   1     2   0
12020   3     2   0
6742    3     2   0
6189    2     3   0
26692   2     3   0
1387    3     2   0
31839   2     3   1
28637   3     2   0

这样的想法是,条显示,其中FIX = 1每因子QUANT和每因子IMG

我已经聚集我的数据设置成使用百分比plyr

library(plyr)
bb.perc <- ddply(bb,.(QUANT,IMG),summarise,FIX.PROP = sum(FIX) / length(FIX))

几乎是正确的事情:

  QUANT IMG   FIX.PROP
1     1   1 0.52439024
2     1   2 0.19085366
3     1   3 0.13658537
4     2   1 0.20414201
5     2   2 0.53964497
6     2   3 0.09585799
7     3   1 0.29000000
8     3   2 0.13000000
9     3   3 0.40705882

但现在,如果我做一个曲线图,它不占FIX==0的情况下,即所有的酒吧具有相同的高度,即100%,这是不是我想要的。 注意看个人QUANT子加起来还不到100%:

> sum(bb.perc[1:3,]$FIX.PROP)
[1] 0.8518293
> sum(bb.perc[4:6,]$FIX.PROP)
[1] 0.839645
> sum(bb.perc[7:9,]$FIX.PROP)
[1] 0.8270588

我可以有R做的最好的是显示计数:

# Take only the positive samples
bb.pos <- bb[bb$FIX == 1,]
# Plot the counts
ggplot(bb,aes(factor(QUANT),fill=factor(IMG))) + geom_bar() +
  scale_y_continuous(labels=percent)

并导致: 这也是不是我想要的:

  • 百分比规模的路要走。 我需要一种方法来通过100%指向percent功能,但我不知道怎么样。
  • 它没有标签。

也有类似的诸多问题已经SO,但我似乎缺乏智慧的足够量(或R的理解),从他们推断解决我的具体问题。

感谢您的指点!

编辑:斯文德国海恩斯坦研究院已经提供一个答案,但在这里就是我终于实现了我自己,以及:

> ggplot(bb.perc,aes(x=factor(QUANT),y=FIX.PROP,label=paste(round(FIX.PROP*100),
     "%"),fill=factor(IMG)))+ geom_bar(stat="identity") + geom_text(position="stack",
     aes(ymax=1),vjust=5) + scale_y_continuous(labels = percent)

使用bb.perc我定义的进一步上涨使用plyr 。 这其中有一个百分比是在本地计算每列,而不是全局的优势。

感谢大家的帮助。 下面的两个问题及其各自的答案中得到它的权利大大帮助了我:

堆积条形图标签与GGPLOT2

添加标签ggplot条形图

我做错了什么最初是通过position = "fill"参数geom_bar()由于某种原因使所有的棒具有相同的高度!

Answer 1:

这是产生剧情的方式:

ggplot(bb[bb$FIX == 1, ],aes(x = factor(QUANT), fill = factor(IMG), 
                             y = (..count..)/sum(..count..))) +
 geom_bar() +
 stat_bin(geom = "text",
          aes(label = paste(round((..count..)/sum(..count..)*100), "%")),
          vjust = 5) +
 scale_y_continuous(labels = percent)

更改的值vjust参数调整标签的垂直位置。



文章来源: R stacked percentage bar plot with percentage of binary factor and labels (with ggplot)
标签: r ggplot2