Lucene是不匹配的,具有上字符的字符串(Lucene is not matching strin

2019-09-22 07:08发布

我使用Lucene搜索引擎(V36),与StandardAnalyzer。 我用的是MultiFieldQueryParser。

我的一个字段设置为NOT_ANALYZED,因为它包含字母数字字符和点的版本名称。 当此字段包含上字符,搜索查找没有结果。 任何想法 ?

细节:

该字段包含类似的值:

  • version1.26.12.test.a
  • version1.26.12.test.b
  • V1.2
  • version1.Dummy

我的搜索返回结果为三个第一上面的例子,但不是最后一个。

我没有定制的Lucene都只是我绕过标准禁用词与Collections.emptySet()。

非常感谢。 迪米特里

Answer 1:

我相信,如果你标记为NOT_ANALYZED它被存储为一个场,但是StandardAnalyzer使用LowerCaseFilter(和其他见链接)。 所以,如果你搜索“version1.Dummy”,您的查询字符串很可能是“version1.dummy”,这将不匹配的存储字符串。



文章来源: Lucene is not matching strings having upper characters