该CRAN实施随机森林的同时提供可变重要措施:基尼重要性,以及定义为广泛使用的置换重要性
对于分类,它是在百分之增加的倍的情况下是OOB和当该变量被置换错误分类。 对于回归,它是在OOB平方残差平均增加时该变量被置换
默认情况下h2o.varimp()只计算了前者。 难道真的在水中没有任何选项来获得替代措施了随机森林模型?
谢谢! ML
该CRAN实施随机森林的同时提供可变重要措施:基尼重要性,以及定义为广泛使用的置换重要性
对于分类,它是在百分之增加的倍的情况下是OOB和当该变量被置换错误分类。 对于回归,它是在OOB平方残差平均增加时该变量被置换
默认情况下h2o.varimp()只计算了前者。 难道真的在水中没有任何选项来获得替代措施了随机森林模型?
谢谢! ML
H2O不算置换重要性。 请参阅文档有关如何变量重要性计算的解释。
为了您的方便,我会粘贴以及下面:
变量重要性是如何计算的DRF?
变量重要性是通过计算每个变量的相对影响确定:该变量是否被在树构建过程分裂和的平方误差(对所有树)改善结果多少期间选择。
一个特点请求对这个问题以前,您就可以按照它在这里 (但要注意它是当前打开)。