hdfs dfs -getpython
hadoop fs,hadoop dfs和hdfs dfs命令的區別:fs既能操做本地文件又能操做分佈式文件系統,而dfs只能操做HDFS分佈式文件系統。hadoop dfs已經廢棄編程
最後,streaming工具提供了豐富的參數來靈活控制做業的過程。網絡
$HADOOP_HOME/bin/hadoop jar $HADOOP_HOME/hadoop-streaming.jar \ -input myInputDirs \ -output myOutputDir \ -mapper /bin/cat \ -reducer /bin/wc
任何可執行文件均可以被指定爲mapper/reducer。這些可執行文件不須要事先存放在集羣上; 若是在集羣上尚未,則須要用-file選項讓framework把可執行文件做爲做業的一部分,一塊兒打包提交。
例如:架構
$HADOOP_HOME/bin/hadoop jar $HADOOP_HOME/hadoop-streaming.jar \ -input myInputDirs \ -output myOutputDir \ -mapper myPythonScript.py \ -reducer /bin/wc \ -file myPythonScript.py