Delete rows based on range of values in column

2019-07-04 03:06发布

I would like to delete rows of data in a dataframe if the values in a column (in this case a participant identification number) fall within a certain range e.g. 61701 to 61721 & 61901 to 61929.

I know how to subset data based on a threshold e.g.:

datasetnew = dataset[dataset$X<=100, ]

But not sure how to subset and remove the rows using a range of numbers. Not sure subset is what I need.

标签： r rows subset

3条回答

对你真心纯属浪费

2楼-- · 2019-07-04 03:36

You should be able to exclude those ranges by including everything less than, greater than, and in between them. Something like:

dataset[dataset$X < 61701 | dataset$X > 61929 | (dataset$X > 61721 & dataset$X < 61901),]

Or using subset:

subset(dataset, X < 61701 | X > 61929 | (X > 61721 & X < 61901)

0人赞添加讨论(0) 举报

forever°为你锁心

3楼-- · 2019-07-04 03:39

Or a more straight forward implementation will be just negate these rows using !

dataset[with(dataset, !((X >= 61701 & X <= 61721) | (X >= 61901 & X <= 61929))), ]

dataset[with(dataset, !((X %in% 61701:61721) | (X %in% 61901:61929))), ]

For a big data set you can use data.tables %between% function

library(data.table)
setDT(dataset)[!(X %between% c(61701, 61721) | X %between% c(61901, 61929))]

0人赞添加讨论(0) 举报

Anthone

4楼-- · 2019-07-04 03:53

Using dplyr package:

exclude <- c(61701:61721, 61901:61929)

library(dplyr)
datasetnew <- dataset %>%
  filter(!(X %in% exclude))

0人赞添加讨论(0) 举报

Delete rows based on range of values in column

采纳回答

编辑标签

举报内容

检举类型

检举原因

检举说明(必填)

打开微信“扫一扫”，打开网页后点击屏幕右上角分享按钮

付费偷看金额在0.1-10元之间