rbind 2个data.frame保留行顺序和行名称(rbind two data.frame p

2019-08-16 20:48发布

我有一个列表data.frame我想排追加到彼此,即对象merge(..., all=T) 然而, merge似乎删除,我需要保持完整的行名。 有任何想法吗? 例:

x = data.frame(a=1:2, b=2:3, c=3:4, d=4:5, row.names=c("row_1", "another_row1"))
y = data.frame(a=c(10,20), b=c(20,30), c=c(30,40), row.names=c("row_2", "another_row2"))
> merge(x, y, all=T, sort=F)
     a  b  c  d
  1  1  2  3  4
  2  2  3  4  5
  3 10 20 30 NA
  4 20 30 40 NA

Answer 1:

既然你知道你实际上并没有合并,而只是rbind-ING,也许这样的事情会工作。 它利用rbind.fill从“plyr”。 要使用它,指定listdata.frame你要发rbind

RBIND <- function(datalist) {
  require(plyr)
  temp <- rbind.fill(datalist)
  rownames(temp) <- unlist(lapply(datalist, row.names))
  temp
}
RBIND(list(x, y))
#               a  b  c  d
# row_1         1  2  3  4
# another_row1  2  3  4  5
# row_2        10 20 30 NA
# another_row2 20 30 40 NA


Answer 2:

一种方法是使用row.names的合并,让你得到它作为一个附加列。

> merge(x, y, by=c("row.names", "a","b","c"), all.x=T, all.y=T, sort=F)

#      Row.names  a  b  c  d
# 1        row_1  1  2  3  4
# 2 another_row1  2  3  4  5
# 3        row_2 10 20 30 NA
# 4 another_row2 20 30 40 NA

编辑:通过查看merge与功能getS3method('merge', 'data.frame')row.names明确设置为NULL(这是一个相当长的代码,所以我不会在这里贴)。

# Commenting 
# Lines 63 and 64
row.names(x) <- NULL
row.names(y) <- NULL

# and 
# Line 141 (thanks Ananda for pointing out)
attr(res, "row.names") <- .set_row_names(nrow(res))

并创建一个新的功能,比如说, MERGE ,作品的OP打算在这个例子。 只是一个实验。



文章来源: rbind two data.frame preserving row order and row names