我使用的rpart
包,以适应某些机型上,就像这样:
fitmodel = function(formula, data, w) {
fit = rpart(formula, data, weights = w)
}
调用自定义函数
fit = fitmodel(y ~ x1 + x2, data, w)
这将导致错误:
Error in eval(expr, envir, enclos) : object 'w' not found
于是我决定用
fitmodel = function(formula, data, w) {
data$w = w
fit = rpart(formula, data, weights = w)
}
这工作,但还有另外一个问题:
这将工作
fit = fitmodel(y ~ x1 + x2, data, w)
这不起作用
fit = fitmodel(y ~ ., data, w)
Error in eval(expr, envir, enclos) : object 'w' not found
什么是应用自定义函数中的权重的正确方法? 谢谢!
希望别人给出了一个更完整的答案。 为什么原因rpart
找不到w
是rpart
搜索该公式在公式在某些环境下最有可能创建的数据,权重等定义的环境GlobalEnv
和w
是一些其他的功能中创建。 改变配方,其中环境的环境w
与创建parent.frame
修复程序。 rpart
仍然可以找到数据,因为搜索路径将一直延续到GlobalEnv
。 我不知道为什么sys.frame(sys.nframe())
的作品,因为环境是不一样的,但显然w
仍然在某处搜索路径
编辑: sys.frame(sys.nframe())
似乎是一样的forumla的环境设置为功能的环境rpart
被称为( foo3
在这个例子中)。 在这种情况下, rpart
寻找w
, data
等在foo3
,然后bar3
那么GlobalEnv
。
library(rpart)
data(iris)
bar <- function(formula, data) {
w <- rpois(nrow(iris), 1)
print(environment())
foo(formula, data, w)
}
foo <- function(formula, data, w) {
print(environment(formula))
fit <- rpart(formula, data, weights = w)
return(fit)
}
bar(I(Species == "versicolor") ~ ., data = iris)
## <environment: 0x1045b1a78>
## <environment: R_GlobalEnv>
## Error in eval(expr, envir, enclos) (from #2) : object 'w' not found
bar2 <- function(formula, data) {
w <- rpois(nrow(iris), 1)
print(environment())
foo2(formula, data, w)
}
foo2 <- function(formula, data, w) {
print(environment(formula))
environment(formula) <- parent.frame()
print(environment(formula))
fit <- rpart(formula, data, weights = w)
return(fit)
}
bar2(I(Species == "versicolor") ~ ., data = iris)
## <environment: 0x100bf5910>
## <environment: R_GlobalEnv>
## <environment: 0x100bf5910>
bar3 <- function(formula, data) {
w <- rpois(nrow(iris), 1)
print(environment())
foo3(formula, data, w)
}
foo3 <- function(formula, data, w) {
print(environment(formula))
environment(formula) <- environment() ## seems to be the same as sys.frame(sys.nframe())
print(environment(formula))
print(environment())
fit <- rpart(formula, data, weights = w)
return(fit)
}
bar3(I(Species == "versicolor") ~ ., data = iris)
## <environment: 0x104e11bb8>
## <environment: R_GlobalEnv>
## <environment: 0x104b4ff78>
## <environment: 0x104b4ff78>
按照rpart包文件(2017年3月12日,第23页,第6.1节),“重量还不支持,如果存在将被忽略。”
https://cran.r-project.org/web/packages/rpart/vignettes/longintro.pdf
我设法这个使用下面的代码来解决,但我敢肯定有一个更好的方法:
弱学习
fitmodel = function(formula, data, w) {
# just paste the weights into the data frame
data$w = w
rpart(formula, data, weights = w, control = rpart.control(maxdepth = 1))
}
该算法
ada.boost = function(formula, data, wl.FUN = fitmodel, test.data = NULL, M = 100) {
# Just rewrites the formula and get ride of any '.'
dep.var = all.vars(formula)[1]
vars = attr(terms(formula, data = data), "term.labels")
formula = as.formula(paste(dep.var, "~", paste(vars, collapse = "+")))
# ...more code
}
现在一切正常!