使用Nutch的爬虫使用Solr

<p>我能够到Apa​​che Nutch的爬虫集成Solr的索引服务器? P&gt; </p><p> <strong>编辑: STRONG&gt; P&gt; <p>我们的一个开发者想出了这些职位的解决方案 P&gt; </p><ol> <li> 运行的Nutch和Solr li&gt; </li><li> <a href="http://www.mail-archive.com/nutch-commits@lucene.apache.org/msg02227.html">更新运行的Nutch和Solr li&gt; OL&gt; <p> <strong>答案 STRONG&gt; P&gt; <p>是 P&gt;
</p></strong></p></li></ol></strong></p>

79 浏览 1 回复
  gt   nutch   solr   使用   运行  

回复

    <p>如果你愿意升级到Nutch的1.0,你可以按照本文由清醒想象中所述使用solrindex:悬而未决的问题。如果你喜欢冒险的感觉,你可以尝试使用这些补丁自己,虽然它看起来像的<a href="htt​​p://www.mail-archive.com/nutch-user@lucene.apache.org/msg10872.html”相对=“nofollow的”&gt;这不是那么简单&lt;/A&gt; &lt;/ P&gt;
    &lt;/div&gt;"></p>

    侯琳

相关信息

使用Nutch的爬虫使用Solr

<p>我是能够到Apa​​che Nutch的爬虫与Solr的索引服务器整合? P&gt; </p><p> <strong>编辑: STRONG&gt; P&gt; <p>我们的一个开发者的想出了这些职位 P&gt;解决方案 </p><ol> <li> [运行的Nutch...

31 浏览 1 回复   gt   nutch   solr   使用   运行  

对于蜘蛛工具,建议使用Lucene Solr的或使用? [关闭]

<p>什么是好的履带式(蜘蛛)使用对HTML和XML文档(本地或基于Web),并在Lucene的/ Solr的解空间的作品呢?可能是基于Java的,但不必须如此。 P&gt; </p>

12 浏览 1 回复   solr   使用   集成   nutch   gt  

对于蜘蛛的工具建议使用Lucene Solr的或使用? [关闭]

<p>什么是好的履带式(蜘蛛)打击HTML和XML文档中使用(本地或基于Web)和行之有效的Lucene的/ Solr的解空间?可以是基于Java的,但不必须是 P&gt; </p>

28 浏览 1 回复   solr   使用   集成   nutch   gt  

对于蜘蛛工具,建议使用Lucene Solr的或使用? [关闭]

<p>什么是好的履带式(蜘蛛)使用对HTML和XML文档(本地或基于Web),并在Lucene的/ Solr的解空间的作品呢?可能是基于Java的,但不必须如此。 P&gt; </p>

18 浏览 1 回复   solr   使用   集成   nutch   gt  

Solr的管理使整合后的Nutch 404错误

<p>我已经按照从[ HTTP的说明:// WWW。 lucidimagination.com/blog/2009/03/09/nutch-solr/ ](http://www.lucidimagination.com/blog/2009/03/09/nutch-solr/) p&gt; </p><p>本来Solr的上升而在这之前运行,可以处理的测试案例...

53 浏览 1 回复   gt   管理   solr   nutch   lt