关联拉动了Solr的非常缓慢(Relevancy boosting very slow in Sol

2019-10-18 21:51发布

我有一个在它约2.5M项Solr的指标,我试图用一个ExternalFileField以提高相关性。 不幸的是,当我试图做到这一点,尽管它是一个结实的机器,并具有大量的可用内存的Solr这是非常缓慢的。

在外部文件我有喜欢的内容:

747501=3.8294805903e-07
747500=3.8294805903e-07
1718770=4.03292174724e-07
1534562=3.8294805903e-07
1956010=3.8294805903e-07
747509=3.8294805903e-07
747508=3.8294805903e-07
1718772=3.8294805903e-07
1391385=3.8294805903e-07
2089652=3.8294805903e-07
1948271=3.8294805903e-07
108368=3.84404072186e-06

每一行是一个文档ID和它相应的提升因素。

在我的查询我使用edismax,和我使用的是提升参数,将其设置为的PageRank。 整个查询是在这里 。

在我的模式我有:

<!-- External File Field Type-->
<fieldType name="pagerank"
           keyField="id"
           stored="false"
           indexed="true"
           omitNorms="false"
           class="solr.ExternalFileField"
           valType="float"/>

   <field name="pagerank"
          type="pagerank"
          indexed="true"
          stored="true"
          omitNorms="false"/>

但性能是正义的,普通的坏。 我缺少一个设置或东西吗?

Answer 1:

据javadoc的

外部文件可以被分类或由密钥字段未排序,但它会大大缓慢的(另)如果它不排序。

当我看到,在文件ID是无序。 你可以对它进行排序和测试,如果有帮助?



文章来源: Relevancy boosting very slow in Solr