nutch2.3+hbase配置

1,版本是個很重要的問題
apache

nutch上面有介紹和nutch配合使用的各框架的版本
框架

2,下載hbase,放在opt/下url

3,tar -zxvf hbase-*spa

4,更改conf 下的 hbase-site.xml文件日誌

添加屬性:orm

<configuration>xml

<property>ip

<name>hbase.rootdir</name>get

<value>hbase-data</value>it

</property>

<property>

<name>hbase.zookeeper.property.dataDir</name>

<value>/opt/hbase-0.94.27/data/zk-data</value>

</property>

</configuration>

5,啓動hbase

6,下載nutch,解壓

在conf /nutch-site.xml中

<property>
<name>storage.data.store.class</name>
<value>org.apache.gora.hbase.store.HBaseStore</value>
<description>Default class for storing data</description>
</property>

並去掉在ivy.xml中的gora-hbase的註釋配置

gora.properties中加入
gora.datastore.default=org.apache.gora.hbase.store.HBaseStore

7,在項目根部錄下ant 

8,若是在ant時出現錯誤,下載不了某個包時,能夠自行下載而後上傳到.ivy中的相應目錄中


問題:

第一次我安裝的是hbase-0.90,在inject時就卡住了,而後日誌也沒有是麼提示,困擾了好幾天,無奈之下,從新換了hbase,終於好了

InjectorJob: starting at 2015-10-28 23:29:20

InjectorJob: Injecting urlDir: urls/url

InjectorJob: Using class org.apache.gora.hbase.store.HBaseStore as the Gora storage class.

InjectorJob: total number of urls rejected by filters: 0

InjectorJob: total number of urls injected after normalization and filtering: 1

Injector: finished at 2015-10-28 23:29:24, elapsed: 00:00:03

相關文章
相關標籤/搜索