我想出去vlfeat,得到的功能大量从图像数据库,而我与地面真理平均平均精度(MAP)测试。 总体来说,我得到了大约40%。 我看到一些报纸的更高了地图,而使用的技术非常相似,我的; 标准袋字。
我目前正在寻找为词技术的标准袋获得更高的地图答案。 当我看到有其他执行诸如SURF并没有什么,让我们坚持到标准Lowe的SIFT和单词的这个问题的标准袋。
所以,事情是这样的,我看到了vl_sift阈值,让您可以在特征选择更加严格。 目前,据我了解,去为更高的门槛可能会网罗更小,更有意义的“好”的功能列表,并有可能降低一些噪音特征。 “好”的功能意味着,给出不同的变化相同的图像,非常相似的特征也在其他图像检测 。
但是,我们有多高应该去这个阈值? 有时候,我看到的图像没有返回功能都具有较高的门槛。 起初,我想的是不断调整阈值,直到我得到更好的地图。 但同样,我认为这是一个坏主意,继续调整只是为了找到相应的数据库最好的地图。 所以我的问题是:
尽管调整阈值可降低功能的号码,并增大阈总是返回数量较少但更好的功能?
有没有更好的办法来获得良好的特点是什么?
什么是其他因素,可以增加获得好等特点率是多少?
看看到一些放出来响应帕斯卡的挑战,近年来的论文。 他们似乎给我的印象是,标准的“特征检测”方法不具有文字包的技术很好地工作。 这是有道理的,当你想想看 - 弓的工作原理是很多薄弱,往往不相关的功能汇集。 这是少谈检测特定对象,而是识别物体和场景的类。 因此,过分强调对正常的“关键功能”可以伤害而不是帮助更多。
因此,我们看到使用密网格 ,甚至随机点作为其特点乡亲。 从以往的经验,利用这些方法在哈里斯的角落,日志,过筛,MSER,或任何类似的一个,对性能有很大的积极影响。
要直接回答你的问题:
是。 从SIFT API :
关键点是通过消除那些可能是不稳定的进一步细化,或者是因为它们是附近的选择的图像的边缘,而不是图像的斑点,或者在具有低对比度的图像的结构中找到。 过滤是通过后续的控制:
峰值阈值。 这是对比接受关键点的最低金额。 它是由通过vl_sift_set_peak_thresh配置SIFT滤镜对象()设置。
边缘阈值。 这是边缘拒绝阈值。 它是由通过vl_sift_set_edge_thresh配置SIFT滤镜对象()设置。
你可以看到在“检测参数”一节中的行动这两个阈值的例子在这里 。
研究表明从现场收率更具描述性的“单词”比使用更“智能”的方法选择的密集选择的特征(例如:SIFT,哈里斯,MSER)。 试试你的话管道袋与vl_feat的DSIFT或PHOW实施。 您应该看到在性能上有很大的改进(假设你的“词”的筛选和分级步骤是调整好)。
密集组特征点后,在该领域最大的突破,似乎一直是“空间金字塔”的方式。 这增加了用于图像产生的字的数量,但提供了一个位置方面的特征 - 东西词袋固有缺乏。 在此之后,请确保您的参数以及调整(这一个功能,您正在使用(SIFT,你使用的是什么分类等。描述,HOG,SURF等),有多少话是在你的词汇)然后..你在积极研究土地。 享受=)