我一直在自学的Weka和学会了如何建立模型,并得到了他们的预测(使用CLI预测)。
当我从以前建立的模型对数据集运行预测,我得到一列是“预测”也被称为预测置信每个实例预测。
我知道%的置信意思,但不应该所有我的预言是我的Weka模型的准确度?
又名如果我有一个J48决策树分类具有90%的准确率,不应该使用这个模型中的每个分类的实例是90%的预测有信心吗?
任何一个知道这个百分比的信心是如何计算或者告诉别人我的模型时,我应该如何读取错误预测和模型的准确性? 谢谢
我一直在自学的Weka和学会了如何建立模型,并得到了他们的预测(使用CLI预测)。
当我从以前建立的模型对数据集运行预测,我得到一列是“预测”也被称为预测置信每个实例预测。
我知道%的置信意思,但不应该所有我的预言是我的Weka模型的准确度?
又名如果我有一个J48决策树分类具有90%的准确率,不应该使用这个模型中的每个分类的实例是90%的预测有信心吗?
任何一个知道这个百分比的信心是如何计算或者告诉别人我的模型时,我应该如何读取错误预测和模型的准确性? 谢谢
基本上,当一个决策树是在数据集中的训练,你经常想(的缺失的功能,或者因为有 )停止它overfits对每一个训练实例之前。 发生这种情况时,你将不得不在树上的叶子节点几个训练样本。 很多时候训练标签仍然会在这一点上混合(并非所有的正类,而不是所有消极类。)
信心是培训标签如何一致是由树了下来,为的是训练实例的叶子的时候一些措施。
编辑:注意,这也可以用来处理缺少的功能(属性)在干净和公正的方式。
在这里看到的这一个简短的定义。
也看一些昆兰的决策树对这项工作的。 特别是他在C4.5工作
又道:“我知道什么%的置信意思,但不应该所有我的预言是我的Weka模型的准确度?”
不,这不是真的,有些训练样本会更容易比其他分类和这些分数反映出这一点。