WhitespaceTokenizerFactory和StandardTokenizerFactor

2019-07-30 02:44发布

我是新来的Solr。通过阅读Solr的维基，我不明白WhitespaceTokenizerFactory和StandardTokenizerFactory之间的差异。什么是他们真正的区别？

Answer 1:

它们在如何分割分析文本标记不同。

该StandardTokenizer这是否基于以下（从Lucene的javadoc中获取）：

该WhitespaceTokenizer做此基础上的空白字符：

一个WhitespaceTokenizer是，在空白划分文本标记生成器。的非空白字符相邻的序列形成的标记。

你应该选择最适合你的应用程序标记生成器。在任何情况下，你必须使用相同的分析仪/断词索引和搜索！

文章来源: Difference between WhitespaceTokenizerFactory and StandardTokenizerFactory

Answer 1: