Apche pig計算數據 導入Hbase

1.pig將數據導入或加載到hbase使用HBaseStorage UDF函數,地址: http://pig.apache.org/docs/r0.11.0/func.html#HBaseStorage

   在shell中案例:

     pig -Dpig.additional.jars=/home/pps_recommend/pig-0.11.0/lib/protobuf-java-2.4.0a.jar -x $varPigMode << EOF
           recommend_data = LOAD '$recommend_output' as(id:chararray,items:chararray);
          STORE recommend_data INTO 'hbase://short_video_recommend' USING org.apache.pig.backend.hadoop.hbase.HBaseStorage('info:items');
     EOF html

   (提示:EOF是將其餘應用程序在shell中輸出,切記:特別在shell中有if判斷語句 EOF要頂格寫) java

 2.    STORE [加載pig數據集別名] INTO 'hbase://[HBASE表名]' USING org.apache.pig.backend.hadoop.hbase.HBaseStorage('[HBASE列簇]:PIG字段名');

 3.注意:
   1.在僞分佈式下啓動,在zookeeper,hbase正常啓動狀況下能夠導入,

    2.正式環境下配置:
       2.1在 $PIG_HOME/conf/pig.properties加入:
     # -----------------------------------------------------------------------------------------------------------------------------------------

       #pig.load.default.statements=      shell

      hbase.zookeeper.quorum=10.11.8.161,10.11.8.162,10.11.8.163,10.11.8.164,10.11.8.165,10.11.8.166,10.11.8.167        apache

      hbase.master.info.bindAddress=10.11.5.222  分佈式

      hbase.master.port=60000 ide

    # -------------------------------------------------------------------------------------------------------------------------------------------- 函數

    #hbase.zookeeper.quorum= zookeeper集羣地址 oop

    #hbase.master.info.bindAddress=hbase master地址 spa

    #hbase.master.port=hbase master端口 htm

   2.2 在$PIG_HOME/lib複製3個包:


        protobuf-java-2.4.0a.jar   
        hbase-0.94.1.jar
        zookeeper-3.4.3.jar

       這個幾個包能夠從$HBASE_HOME/lib 和 $HBASE_HOME目下獲取
相關文章
相關標籤/搜索