Greenplum的gpload工具使用可讀外部表和Greenplum並行文件服務器(gpfdist或者gpfdists)來裝載數據。它處理並行的基於文件的外部表設置而且容許用戶在一個單一配置文件中配置他們的數據格式、外部表定義以及gpfdist或者gpfdists設置。使用gpload工具,須要編寫gpload的控制文件,這個控制文件是一個yaml格式文件,以下圖所示:
而後執行gpload進行裝載操做,以下:
控制文件的說明:
一、gpload的控制文件,同級的參數必定要保持一致的縮進;
二、"-"後面必定要有空格,若是":"後面要跟參數值,那麼":"後面也必定要有空格;
三、gpload控制文件中也能夠寫一些SQL語句,如上圖中,裝載以前(before)truncate表,裝載完成後(after)收集表的統計信息;
四、針對gpfdist的參數,也能夠在控制文件中指定,好比上述指定了MAX_LINE_LENGTH、port參數。
詳細的參數說明以下圖所示:
參考文獻:
一、gpload官方手冊。
二、Greenplum中文手冊
三、單獨安裝Greenplum Loaders請參考這篇文章。html