我有深度和温度数据的下述矩阵(855行,2列),并希望采取的每一列内的每个3行的平均值。 例如:
[1,] -6.7 18.91
[2,] -5.4 18.91
[3,] -4.0 18.59
[4,] -6.7 20.37
[5,] -6.7 20.05
[6,] -2.7 20.21
[7,] -4.0 21.03
[8,] -5.4 20.70
[9,] -4.0 20.87
[10,] -2.7 21.37
[11,] -2.7 21.37
[12,] -2.7 21.37
mean(data[1:3,1])
mean(data[4:6,1])
对整个矩阵。 我怎样才能做到这一点无需手动编写代码,每3行是什么意思? 任何意见或建议,不胜感激。
使用rollapply
从动物园配套功能。 见?rollapply
了解更多详情。
library(zoo)
rollapply(matrix[,1], width=3, mean, by=3)
例:
> set.seed(1)
> Data <- matrix(rnorm(30, 100, 50), ncol=2) # some random data
> rollapply(Data[,1], width=3, mean, by=3)
[1] 78.69268 118.40534 130.02559 126.60393 71.48317
> # you could check this out by doing some verification as in:
> mean(Data[1:3, 1])
[1] 78.69268
> mean(Data[4:6, 1])
[1] 118.4053
> mean(Data[7:9, 1]) # and so on ...
[1] 130.0256
如果你想在你的矩阵所有列的平均值,然后只需添加by.column=TRUE
在rollapply
电话:
> rollapply(Data, width=3, mean, by=3, by.colum=TRUE)
[,1] [,2]
[1,] 78.69268 114.71187
[2,] 118.40534 138.90166
[3,] 130.02559 81.12249
[4,] 126.60393 106.79836
[5,] 71.48317 74.48399
尝试使用tapply
和apply
:
R > f <- rep(c(1:3), each = 3)
R > f
[1] 1 1 1 2 2 2 3 3 3
R > x <- matrix(1:27, 9, 3)
R > x
[,1] [,2] [,3]
[1,] 1 10 19
[2,] 2 11 20
[3,] 3 12 21
[4,] 4 13 22
[5,] 5 14 23
[6,] 6 15 24
[7,] 7 16 25
[8,] 8 17 26
[9,] 9 18 27
R > apply(x, 2, function(t) tapply(t, f, mean))
[,1] [,2] [,3]
1 2 11 20
2 5 14 23
3 8 17 26
我真的很喜欢这个“rollapply”功能,因为它的语法非常匹配你想要做什么。 不过,我以为我会做出贡献,为后人,你将如何处理这个问题与“plyr”包。
注意:您可以做到这一切在一个声明,但我打破它,使它更容易理解。
第1步 :设置你的数据有一个排序变量。
data.plyr <- data.frame(test, group=floor((1:nrow(test)-1)/3)+1)
我只是增加了一个列“组”指派一组号码,以每三列。 这两个矩阵的列现在“X1”,默认情况下“X2”。
步骤2:运行每个组的“colMeans”功能。
library(plyr)
ddply(data.plyr, .(group), colMeans)
对于这个具体问题,我认为“plyr”包是次优的,但值得注意的供将来参考方法。 在“应用”家庭和“rollapply”职能的工作最好与数据的连续性和一致性。 在你想要更多的灵活性的应用,“plyr的家庭功能是在你的工具箱中非常有用。