全文搜索使用Rails(Full Text Searching with Rails)

2019-06-26 01:19发布

我一直在寻找到为Rails插件搜索/宝石。 大部分文章比较鼬(Lucene的),以Ultrasphinx或可能思考狮身人面像,但没有谈关于SearchLogic 。 没有人有任何线索,怎么说一个比较? 你用什么,以及它是如何执行?

Answer 1:

  • thinking_sphinx和狮身人面像做工精美,没有索引,查询,以往安装的问题(5或6安装,包括生产slicehost)

  • 为什么不是每个人都使用狮身人面像,像,说Craigslist的? 在这里阅读有关它的局限性(一年半老的文章。狮身人面像开发商,Aksyonoff,正在研究这些,他的推杆在功能和可靠性,并以惊人的速度扑灭错误)

http://codemonkey.ravelry.com/2008/01/09/sphinx-for-search/

http://www.ibm.com/developerworks/opensource/library/os-php-apachesolr/

Lucene的,狮身人面像和PostgreSQL,MySQL的-全文搜索引擎的比较?

  • 鼬:安装方便,不正确地干,很慢的索引(一个MySQL数据库:斯芬克斯:3秒,鼬:50分钟)。 有据可查的问题(腐败指数)的DRB服务器在生产负荷下。 说了这么多,我已经用它在develometn因为行为,as_ferret 3年前就出来了,它已使我受益匪浅。 不遵守波特词干是在某些情况下具有优势。

  • Lucene和Solr的是开源搜索的大猩猩/麦克卡车/重量级冠军。 该团队一直在做的新功能令人印象深刻的数量的Solr 14日发布:

  • 行为-AS-Solr的:效果很好,一旦Tomcat或码头的很到位,但这些有时是一种痛苦。 在通过mattmatt AAS叉是主要的岔路口,但该项目相对无人维护。

  • 重新Tomcat的安装:SOLR / Lucene的无疑有任何软件包我已经看到了(我想我不会感到惊讶),这里的搜索框的最好的知识基础/支持的搜索引擎:

http://www.lucidimagination.com/

  • 太阳黑子新红宝石包装,建立在Solr的旁注。 看起来很有希望,但我无法得到它安装在OSX。 指标均红宝石对象,不只是通过数据库AR

  • 一两件事是真正有益的是安装2个搜索插件,例如狮身人面像和SOLR,狮身人面像深挖,看看他们返回什么不同的结果。 它是那么容易,因为@sphinx_results - @ferret_results


刚看到这个帖子和响应

http://zooie.wordpress.com/2009/07/06/a-comparison-of-open-source-search-engines-and-indexing-twitter/

http://www.jroller.com/otis/entry/open_source_search_engine_benchmark

http://www.flax.co.uk/blog/2009/07/07/xapian-compared/



Answer 2:

首先,我明显的倾向性:我创建并维护思考狮身人面像。

由于恰巧,我居然看到了本·约翰逊(SearchLogic的创建者)出席关于它的NYC红宝石满足昨晚。 SearchLogic是SQL只 - 所以,如果你不进行大规模的表格处理,并且不需要相关的排名,那么它可能是你在寻找什么。 语法是很干净,太。

但是,如果你想所有的代码处理查询的情报,是不是你自己的,然后狮身人面像或Solr的(这是引擎盖下Lucene的,我觉得)很可能会发展得更好。



Answer 3:

SearchLogic是一个很好的插件,但实际上意味着让你的搜索代码的可读性,它并没有提供自动索引,那个狮身人面像一样。 我没有用白鼬,但狮身人面像威力惊人。

http://railscasts.com/episodes/120-thinking-sphinx

伟大的介绍看看它是多么灵活。



Answer 4:

我没有使用过SearchLogic,但我可以告诉你,Lucene是一个非常成熟的项目,已在许多语言的实现。 它是快速,灵活和API是有趣的工作。 这是一个不错的选择。



Answer 5:

鉴于这一问题仍然是高度在谷歌全文搜索排名,我真的很想说, 太阳黑子是今天更强大,如果你有兴趣加入的全文检索功能,您的Rails应用程序(并希望有Solr的背后你说)。 您可以在此查看完整的教程在这里 。

虽然我们在这,在外地已经到达另一个竞争者是ElasticSearch ,其目的是(相比于Solr的时候,但不同的事情)建立在Lucene之上的实时全文搜索引擎。 ElasticSearch包括外的开箱拆分和复制到多个节点,更快的实时搜索,“渗滤器”,让你收到通知时的东西,符合您的标准变为可用,它的移动非常快多了很多其他功能。 这很容易建立在它之上的东西,因为API是死的简单和使用JSON作为格式完全基于REST。 有人可能会说,你甚至都不需要一个插件来使用它。



Answer 6:

就个人而言,我不为Web应用程序的数据库不可知论者的麻烦和使用pg83全文搜索也很乐意。 好处是,如果当你改变你的框架/语言,你仍然会有全文搜索。



Answer 7:

为寻找一个简单的搜索宝石没有任何相关性,退房acts_as_indexed



文章来源: Full Text Searching with Rails