删除行FF包(delete rows ff package)

2019-08-03 19:34发布

由于有一段时间了从来就为了与大数据工作一直使用FF包。 将R对象从来就合作过的大约有130.000.000行和14列。 这些列,气温和降水两缺少值“NA”所以我需要为我的工作向前迈进,删除这些行。 从来就一直在努力做像我会在一个正常的[R对象:

data<-data[!is.na(data$temp),]

不过,我不断收到错误:

Error: vmode(index) == "integer" is not TRUE

有没有人已经能够在ffdf对象删除行? 我倒是欣赏任何帮助。

Answer 1:

基于逻辑ff_vector索引是不是在FF可能,你需要提供FF整数向量。 这就是错误消息要告诉你。 所以你可以做这样的子集

require(ffbase)
idx <- !is.na(data$temp)
idx <- ffwhich(idx, idx == TRUE)
data <- data[idx, ]

或(使用ffbase的6.3版本)

require(ffbase)
data <- subset(data, !is.na(temp))


文章来源: delete rows ff package
标签: r ff ffbase