所謂網關機是指經過該機器來訪問hadoop集羣,由於在實際的生產環境中一般不是直接將pig安裝到hadoop集羣中的某個節點上,而是在一臺可以訪問hadoop集羣的機器上安裝pig。pig只是做爲一個特殊的hadoop客戶端,它能夠使用local模式也能夠使用mapreduce模式,在生產環境中pig都是使用mapreduce模式的,因此它須要hadoop集羣的hdfs與mapreduce的支持,通俗的說就是pig客戶端可以肯定NameNode與JobTracker的位置,而這兩個信息都是經過hadoop安裝目錄中conf目錄下的配置文件中肯定的,因此pig只須要定位到hadoop的conf目錄便可。ide
配置pig方法:oop
在pig的解壓目錄的bin目錄下的pig執行腳本中添加一個變量:PIG_CLASSPATH=${HADOOP_HOME}/conf就好了,而後直接運行pig就能夠看到日誌輸出已經鏈接到hadoop集羣了。日誌