1,版本是個很重要的問題
apache
nutch上面有介紹和nutch配合使用的各框架的版本
框架
2,下載hbase,放在opt/下url
3,tar -zxvf hbase-*spa
4,更改conf 下的 hbase-site.xml文件日誌
添加屬性:orm
<configuration>xml
<property>ip
<name>hbase.rootdir</name>get
<value>hbase-data</value>it
</property>
<property>
<name>hbase.zookeeper.property.dataDir</name>
<value>/opt/hbase-0.94.27/data/zk-data</value>
</property>
</configuration>
5,啓動hbase
6,下載nutch,解壓
在conf /nutch-site.xml中
<property>
<name>storage.data.store.class</name>
<value>org.apache.gora.hbase.store.HBaseStore</value>
<description>Default class for storing data</description>
</property>
並去掉在ivy.xml中的gora-hbase的註釋配置
在gora.properties中加入
gora.datastore.default=org.apache.gora.hbase.store.HBaseStore
7,在項目根部錄下ant
8,若是在ant時出現錯誤,下載不了某個包時,能夠自行下載而後上傳到.ivy中的相應目錄中
問題:
第一次我安裝的是hbase-0.90,在inject時就卡住了,而後日誌也沒有是麼提示,困擾了好幾天,無奈之下,從新換了hbase,終於好了
InjectorJob: starting at 2015-10-28 23:29:20
InjectorJob: Injecting urlDir: urls/url
InjectorJob: Using class org.apache.gora.hbase.store.HBaseStore as the Gora storage class.
InjectorJob: total number of urls rejected by filters: 0
InjectorJob: total number of urls injected after normalization and filtering: 1
Injector: finished at 2015-10-28 23:29:24, elapsed: 00:00:03