Pig詳解

1.   整體描述 Pig包括兩部分:①用於描述數據流的語言,稱爲Pig Latin;②用於運行Pig Latin程序的執行環境,當前有兩個環境:單JVM中的本地執行環境和hadoop集羣上的分佈式執行環境。 一個Pig Latin程序有一系列的操作和變換組成。每個操作或變換對輸入進行數據處理,然後產生輸出結果。這些操作整體上描述了一個數據流。Pig執行環境把數據流翻譯爲可執行的內部表示,並運行它
相關文章
相關標籤/搜索