计算精确度和召回(Calculate Precision and Recall)

2019-08-03 17:37发布

我真搞不清楚如何使用NB分类计算精度和召回监督机器学习算法

例如说
1)I有两个类A,B
2)I具有10000篇文献外面2000前进到训练样本集(类A = 1000,B类= 1000)
3)现在,在上述训练样本集的基础上进行分类使用NB分类其余8000个文档
4)现在5000页的文件分类后进入A级和3000个文档去B类
5)现在如何计算精度和召回?

请帮我..

谢谢

Answer 1:

嗨,你必须分配结果分为四组 -
真正的A级(TA) - 正确地划分为A级
假A类(FA) - 错误地划分为A级
真正的B类(TB) - 正确地划分为B类
假类B(FB) - 错误地分类为B类

精度= Y /(Y + OD)
回想= Y /(Y + FB)

您可能还需要准确性和F-措施:

精度=(TA + TB)/(TA + TB + FA + FB)
F值= 2 *((*精度召回)/(精度+召回))

更多在这里:
http://en.wikipedia.org/wiki/Precision_and_recall#Definition_.28classification_context.29



Answer 2:

让我解释一点的清晰度。

假设有9只和一些猫的视频和图像处理算法告诉你有7只犬现场,这出只有4个实际上是狗(真阳性),而3是猫(误报)

精密告诉我们走出列为狗的项目,有多少这里居然狗

所以精密=真阳性/(真阳性+假阳性)= 4 /(4 + 3)= 4/7

虽然召回告诉了狗的总数,有多少狗,其中居然发现的。

所以召回=真阳性/总数=真阳性/(真阳性+假阴性)= 4/9


在你的问题

你必须找到准确率和召回的A类和B类

对于A类

真阳性=(在5000个分类的A类文件类A文件数量)

假阳性=(在5000个分类A类文件B类文件的数量)

从上面你可以找到精准。

召回=真阳性/(总A类文件的同时,检测使用的号码)

重复以上的B类找到它的精确度和召回。



文章来源: Calculate Precision and Recall