nutch2.3抓取的網頁使用solr創建索引

1,安裝solrubuntu

2,將NUTCH_HOME/runtime/local/conf/schema-solr4.xml複製到SOLR_HOME/excample/solr/collection1/conf/下,並更名爲schema.xml,在文件中添加<field name="_version_" type="long" indexed="true" stored="true"/>dom

3,啓動hbasethis

若是是hbase 0.94.*的版本須要修改hostspa

官方是這麼說的:
code

The following /etc/hosts file works correctly for HBase 0.94.x and earlier, on Ubuntu. Use this as a template if you run into trouble.xml

127.0.0.1 localhost
127.0.0.1 ubuntu.ubuntu-domain ubuntu


關鍵是下面這條命令,就會在solr中創建索引索引

bin/nutch solrindex http://127.0.0.1:8983/solr/ -reindex -crawlId 6vhao
ci

相關文章
相關標籤/搜索