你能帮我使用Tomcat以及如何使用Solr的索引MS SQL数据库配置Apache Solr实现。 什么是配置Tomcat给Tomcat运行Apache Solr实现的步骤。
Answer 1:
这里是一步一步的过程,这将有助于。
第1部分:建立与SOLR TOMCAT
第1步:下载Solr的。 这只是一个zip文件。
第2步:从您的SOLR_HOME_DIR /距离/ Apache的Solr的-1.3.0.war复制到tomcat的webapps目录下:$ CATALINA_HOME / webapps /下solr.war - 注意war文件名变化。 这一点很重要。
第3步:在您选择的位置创建Solr的主目录。 这是针对Solr的配置安装所在。 要做到这一点最简单的方法是复制SOLR_HOME_DIR /例子/ Solr的目录无论它是您希望Solr的主容器中。 说,在C座它:\ Solr的。
第4步:希望你有你的设置环境变量,如果没有的话,请设置JAVA_HOME,JRE_HOME,CATALINA_OPTS,CATALINA_HOME。 需要注意的是CATALINA_HOME指的是Tomcat的目录和CATALINA_OPTS指的是你想给你的Solr的堆内存量。
第5步:启动tomcat。 请注意,这仅仅是必要的,让Tomcat来解开你的战争文件。 如果你看一下在$ CATALINA_HOME / webapps中现在应该是一个Solr的目录。
步骤6:停止Tomcat
第7步:进入该目录的Solr和编辑WEB-INF / web.xml文件。 向下滚动,直到你看到类似的条目:
<!-- People who want to hardcode their "Solr Home" directly into the
WAR File can set the JNDI property here...
-->
<!--
<env-entry>
<env-entry-name>solr/home</env-entry-name>
<env-entry-value>/Path/To/My/solr/Home/solr/</env-entry-value>
<env-entry-type>java.lang.String</env-entry-type>
</env-entry>
-->
设置你的Solr的主(例如:C:\ SOLR)是,取消对ENV条目。
第8步:重新启动Tomcat,事情应该会出色。 你应该能够验证试图URL中的Solr的运行的http://本地主机:8080 / Solr的/管理/ 。
第2部分:建立与SOLR MSSQL Server中使用数据导入HANDLER
第1步:下载的Microsoft SQL Server JDBC驱动程序3.0。 只需提取内容。 您Solr的主目录下创建一个文件夹(例如:C:\ Solr的\ LIB)。 文件sqljdbc4.jar复制上面下载到它的存档。
第2步:所以在你的Solr的主所需的基本目录是形态和lib。 您可能已经使用的第1部分和LIB第3步得到的第一个即是CONF你在第2部分第1步创建的目录。
步骤3.转到conf目录。 请您编辑器中打开的3个文件:数据-config.xml中,schema.xml中和solrconfig.xml中。
第4步:开始编辑数据-config.xml中。 请将您的SQL查询,数据库名称,服务器名称等等。举个例子:
• <dataConfig>
• <dataSource type="JdbcDataSource" driver="com.microsoft.sqlserver.jdbc.SQLServerDriver" url="jdbc:sqlserver://X.Y.Z.U:1433;databaseName=myDB" user="test" password="tester" />
• <document>
• <entity name="Text" query="select DocumentId, Data from Text">
• <field column="DocumentId" name="DocumentId" />
• <field column="Data" name="Data" />
• </entity>
• </document>
• </dataConfig>
第5步:告诉Solr的关于我们的数据-config.xml文件。 这将通过增加一个请求处理程序的文件solrconfig.xml中这是solr的配置文件来实现。 以下requesthandler添加到solrconfig.xml中:
• <requestHandler name="/dataimport" class="org.apache.solr.handler.dataimport.DataImportHandler">
• <lst name="defaults">
• <str name="config">C:\solr\conf\data-config.xml</str>
• </lst>
• </requestHandler>
步骤6:配置schema.xml中 - 在这个文件中,你可以做一些东西一样设置您的字段的数据类型,设置搜索等的唯一/主键
第七步:启动Tomcat
第8步:现在访问的http://本地主机:8080 / Solr的/管理/ dataimport.jsp处理器= / dataimport和启动全进口。
一些有用的注意事项:
• There are a number of reasons a data import could fail, most likely due to problem with
the configuration of data-config.xml. To see for sure what's going on you'll have to look in
C:\tomcat6\logs\catalina.*.
• If you happen to find that your import is failing due to system running out of memory,
however, there's an easy, SQL Server specific fix. Add responseBuffering=adaptive and
selectMethod=cursor to the url attribute of the dataSource node in data-config.xml. That stops the
JDBC driver from trying to load the entire result set into memory before reads can occur.
• Note that by default the index gets created in C:\Tomcat6\bin\solr\data\index. To change this path
just edit solrconfig.xml & change <dataDir>${solr.data.dir:./solr/data}</dataDir>.
• In new Solr versions, I think 3.0 and above you have to place the 2 data import handler
jars in your solr lib directory (i.e. for example apache-solr-dataimporthandler-3.3.0.jar & apache-
solr-dataimporthandler-extras-3.3.0.jar). Search for them in your Solr zip you downloaded. In older
Solr versions this is not required because they are bundled with solr.war. Since we have placed the
data import handlers in the lib directory so we need to specify their paths in solrconfig.xml. Add
this line to solrconfig.xml: (Example: <lib dir="C:/solr/lib/" regex="apache-solr-dataimporthandler-
\d.*\.jar" />)