-->

申请权重rpart包模型给出了错误(Apply weights in rpart model giv

2019-10-19 12:27发布

我使用的rpart包,以适应某些机型上,就像这样:

fitmodel = function(formula, data, w) {

    fit = rpart(formula, data, weights = w)
}

调用自定义函数

fit = fitmodel(y ~ x1 + x2, data, w)

这将导致错误:

Error in eval(expr, envir, enclos) : object 'w' not found

于是我决定用

fitmodel = function(formula, data, w) {

    data$w = w
    fit = rpart(formula, data, weights = w)
}

这工作,但还有另外一个问题:

这将工作

fit = fitmodel(y ~ x1 + x2, data, w)

这不起作用

fit = fitmodel(y ~ ., data, w)

Error in eval(expr, envir, enclos) : object 'w' not found

什么是应用自定义函数中的权重的正确方法? 谢谢!

Answer 1:

希望别人给出了一个更完整的答案。 为什么原因rpart找不到wrpart搜索该公式在公式在某些环境下最有可能创建的数据,权重等定义的环境GlobalEnvw是一些其他的功能中创建。 改变配方,其中环境的环境w与创建parent.frame修复程序。 rpart仍然可以找到数据,因为搜索路径将一直延续到GlobalEnv 。 我不知道为什么sys.frame(sys.nframe())的作品,因为环境是不一样的,但显然w仍然在某处搜索路径

编辑: sys.frame(sys.nframe())似乎是一样的forumla的环境设置为功能的环境rpart被称为( foo3在这个例子中)。 在这种情况下, rpart寻找wdata等在foo3 ,然后bar3那么GlobalEnv

library(rpart)
data(iris)

bar <- function(formula, data) {
   w <- rpois(nrow(iris), 1)
   print(environment())
   foo(formula, data, w)
}

foo <- function(formula, data, w) {
  print(environment(formula))
  fit <- rpart(formula, data, weights = w)
  return(fit)
}


bar(I(Species == "versicolor") ~ ., data = iris)
## <environment: 0x1045b1a78>
## <environment: R_GlobalEnv>
## Error in eval(expr, envir, enclos) (from #2) : object 'w' not found


bar2 <- function(formula, data) {
  w <- rpois(nrow(iris), 1)
  print(environment())
  foo2(formula, data, w)
}

foo2 <- function(formula, data, w) {
  print(environment(formula))
  environment(formula) <- parent.frame()
  print(environment(formula))
  fit <- rpart(formula, data, weights = w)
  return(fit)
}

bar2(I(Species == "versicolor") ~ ., data = iris)
## <environment: 0x100bf5910>
## <environment: R_GlobalEnv>
## <environment: 0x100bf5910>


bar3 <- function(formula, data) {
  w <- rpois(nrow(iris), 1)
  print(environment())
  foo3(formula, data, w)
}

foo3 <- function(formula, data, w) {
  print(environment(formula))
  environment(formula) <- environment() ## seems to be the same as sys.frame(sys.nframe())
  print(environment(formula))
  print(environment())
  fit <- rpart(formula, data, weights = w)
  return(fit)
}

bar3(I(Species == "versicolor") ~ ., data = iris)
## <environment: 0x104e11bb8>                                                                                                                                                                                                                 
## <environment: R_GlobalEnv>                                                                                                                                                                                                                 
## <environment: 0x104b4ff78>                                                                                                                                                                                                                 
## <environment: 0x104b4ff78>


Answer 2:

按照rpart包文件(2017年3月12日,第23页,第6.1节),“重量还不支持,如果存在将被忽略。”

https://cran.r-project.org/web/packages/rpart/vignettes/longintro.pdf



Answer 3:

我设法这个使用下面的代码来解决,但我敢肯定有一个更好的方法:

弱学习

fitmodel = function(formula, data, w) {

    # just paste the weights into the data frame
    data$w = w
    rpart(formula, data, weights = w, control = rpart.control(maxdepth = 1))
}

该算法

ada.boost = function(formula, data, wl.FUN = fitmodel, test.data = NULL, M = 100) {

    # Just rewrites the formula and get ride of any '.'
     dep.var = all.vars(formula)[1]
     vars = attr(terms(formula, data = data), "term.labels")
     formula = as.formula(paste(dep.var, "~", paste(vars, collapse = "+")))


    # ...more code
}

现在一切正常!



文章来源: Apply weights in rpart model gives error
标签: r function rpart