GreenPlum數據的裝載與卸載之copy命令的使用

Copy是PostgreSql數據庫自帶的數據工具,它不只支持表於表之間的數據加載,也支持文件於表之間的數據加載和表對文件的數據卸載。對於Greenplum數據庫,使用copy命令進行數據加載,數據須要通過Master節點分發到Segment節點;一樣使用copy命令進行數據卸載,數據也須要由Segment發送到Master節點,由Master節點彙總後再寫入外部文件,這樣就限制了數據加載與卸載的效率,數據量較小的狀況下,使用copy命令就很是方便。數據庫

一、建立測試表

GreenPlum數據的裝載與卸載之copy命令的使用
因爲在建表語句中,沒有指定具體使用哪一個字段進行數據分發(分佈鍵),默認使用隨機分佈。這裏系統使用package_id做爲分佈鍵進行數據分發。ide

二、數據的卸載

這裏的數據將使用copy命令從PostgreSQL數據庫中導出,以下:
GreenPlum數據的裝載與卸載之copy命令的使用
若是字段中含有空值,在TEXT模式中默認的字符串是\N(反斜線加上N),在CSV模式中是一個沒有引用的空值。以下:
GreenPlum數據的裝載與卸載之copy命令的使用
一樣,此方法在greenplum上有效。工具

三、數據的加載

使用copy命令加載數據,必須使用超級用戶操做。
GreenPlum數據的裝載與卸載之copy命令的使用
如上圖所示,加載完成後,經過查詢可見數據分佈比較均勻,基本平均分佈在3個Segment節點上。測試

相關文章
相關標籤/搜索