Sqoop簡介mysql
Sqoop(發音:skup)是一款開源的工具,主要用於在Hadoop(Hive)與傳統的數據庫(mysql、postgresql...)間進行數據的傳遞,能夠將一個關係型數據庫(例如 : MySQL ,Oracle ,Postgres等)中的數據導進到Hadoop的HDFS中,也能夠將HDFS的數據導進到關係型數據庫中。sql
Sqoop項目開始於2009年,最先是做爲Hadoop的一個第三方模塊存在,後來爲了讓使用者可以快速部署,也爲了讓開發人員可以更快速的迭代開發,Sqoop獨立成爲一個Apache項目。數據庫
Sqoop下載apache
最新的官方版本爲1.4.7下載地址以下ubuntu
http://mirror.bit.edu.cn/apache/sqoop/1.4.7/工具
解壓oop
tar -xvf sqoop-1.4.7.bin__hadoop-2.6.0.tar.gzpost
mv sqoop-1.4.7.bin__hadoop-2.6.0.tar.gz sqoop測試
配置環境變量postgresql
export SQOOP_HOME=/home/ubuntu/sqoop
export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$SQOOP_HOME/bin
cd sqoop/conf
cp sqoop-env-template.sh sqoop-env.sh
測試數據庫鏈接
sqoop list-databases --connect jdbcUrl --username test --password 'test'
導入數據到hdfs中
sqoop import jdbcUrl --username 用戶名 --password '密碼' --table 表名 --columns "user_name,phone" --target-dir /test -m 1