我使用随机森林从Weka的3.7.11这又是套袋Weka中的RandomTree。 我的输入属性的数值和输出属性(标签)也数值。
当训练RandomTree,K属性随机选择为树的每个节点。 根据这些属性的几个分裂在尝试和“最好”的一个选择。 如何Weka中确定哪些分裂最好是在这个(数字)的情况下?
对于标称属性,我相信Weka的使用信息增益是基于条件熵标准。
IG(T|a) = H(T) - H(T|a)
用于数值属性相似的地方? 也许微分熵?
我使用随机森林从Weka的3.7.11这又是套袋Weka中的RandomTree。 我的输入属性的数值和输出属性(标签)也数值。
当训练RandomTree,K属性随机选择为树的每个节点。 根据这些属性的几个分裂在尝试和“最好”的一个选择。 如何Weka中确定哪些分裂最好是在这个(数字)的情况下?
对于标称属性,我相信Weka的使用信息增益是基于条件熵标准。
IG(T|a) = H(T) - H(T|a)
用于数值属性相似的地方? 也许微分熵?
当树是在数值属性分裂时,其被划分于像条件a>5
。 所以,这种情况实际上就变成二元变量和标准(信息增益)绝对是一样的。
PS对于常用的回归是平方误差的总和(对于每个叶,然后求和叶)。 但我不知道具体有关的Weka