我真搞不清楚如何使用NB分类计算精度和召回监督机器学习算法
例如说
1)I有两个类A,B
2)I具有10000篇文献外面2000前进到训练样本集(类A = 1000,B类= 1000)
3)现在,在上述训练样本集的基础上进行分类使用NB分类其余8000个文档
4)现在5000页的文件分类后进入A级和3000个文档去B类
5)现在如何计算精度和召回?
请帮我..
谢谢
我真搞不清楚如何使用NB分类计算精度和召回监督机器学习算法
例如说
1)I有两个类A,B
2)I具有10000篇文献外面2000前进到训练样本集(类A = 1000,B类= 1000)
3)现在,在上述训练样本集的基础上进行分类使用NB分类其余8000个文档
4)现在5000页的文件分类后进入A级和3000个文档去B类
5)现在如何计算精度和召回?
请帮我..
谢谢
嗨,你必须分配结果分为四组 -
真正的A级(TA) - 正确地划分为A级
假A类(FA) - 错误地划分为A级
真正的B类(TB) - 正确地划分为B类
假类B(FB) - 错误地分类为B类
精度= Y /(Y + OD)
回想= Y /(Y + FB)
您可能还需要准确性和F-措施:
精度=(TA + TB)/(TA + TB + FA + FB)
F值= 2 *((*精度召回)/(精度+召回))
更多在这里:
http://en.wikipedia.org/wiki/Precision_and_recall#Definition_.28classification_context.29
让我解释一点的清晰度。
假设有9只和一些猫的视频和图像处理算法告诉你有7只犬现场,这出只有4个实际上是狗(真阳性),而3是猫(误报)
精密告诉我们走出列为狗的项目,有多少这里居然狗
所以精密=真阳性/(真阳性+假阳性)= 4 /(4 + 3)= 4/7
虽然召回告诉了狗的总数,有多少狗,其中居然发现的。
所以召回=真阳性/总数=真阳性/(真阳性+假阴性)= 4/9
你必须找到准确率和召回的A类和B类
对于A类
真阳性=(在5000个分类的A类文件类A文件数量)
假阳性=(在5000个分类A类文件B类文件的数量)
从上面你可以找到精准。
召回=真阳性/(总A类文件的同时,检测使用的号码)
重复以上的B类找到它的精确度和召回。