postgresql cstore_fdw安裝與性能測試

據介紹,cstore_fdw實現了 PostgreSQL 數據庫的列式存儲。列存儲很是適合用於數據分析的場景,數據分析的場景下數據是批量加載的。
這個擴展使用了Optimized Row Columnar (ORC)數據存儲格式,ORC改進了Facebook的RCFile格式,帶來以下好處:

壓縮:將內存和磁盤中數據大小削減到2到4倍。能夠擴展以支持不一樣壓縮算法。
列投影:只提取和查詢相關的列數據。提高IO敏感查詢的性能。
跳過索引:爲行組存儲最大最小統計值,並利用它們跳過無關的行。html

其實官方自測性能也最多就提高了1倍,大多數在10%到50%之間(這裏也有一個測試:http://blog.chinaunix.net/uid-20726500-id-4325901.html,不過LZ是根據實際生產場景進行的)。趁着假期對比各基於SQL的數據庫平臺,順帶測一下。git

注:pg目前自己沒有列式存儲特性(只有基於pg的純粹列式模式pg),卻是有提交的patch,能夠參考https://yq.aliyun.com/articles/691878,可是沒有被合併。github

安裝

從https://github.com/citusdata/cstore_fdw下載最新版本,例如cstore_fdw v1.6.1,支持pg 11.5。算法

安裝protobuf-c,以下:sql



一開始某臺測試機器由於不能訪問外網,下載了yum install protobuf-c-develprotobuf-c-compiler和protobuf源碼進行安裝。好不容易安裝好了,可是最後安裝cstore_fdw自己時,遇到Unrecognized syntax identifier "proto3". This parser only recognizes "proto2"(這裏有個未經驗證的解決方法:https://blog.csdn.net/AmbitiousRuralDog/article/details/80774518),罷了,最後仍然回去使用yum安裝了。
而後編譯cstore_fdw便可。以下:
postgresql.conf中增長shared_preload_libraries 配置,以下:
shared_preload_libraries = 'cstore_fdw'    # (change requires restart)

 測試:數據庫

-- load extension first time after install
CREATE EXTENSION cstore_fdw;

-- create server object
CREATE SERVER cstore_server FOREIGN DATA WRAPPER cstore_fdw;

-- 建立測試表,具體能夠參考github官網

CREATE FOREIGN TABLE xxx_FDW
(
-- 字段列表
)
SERVER cstore_server
OPTIONS(filename '/disk01/cstore/xxx_FDW.cstore',compression 'pglz');ide


-- 執行SQL(多表關聯,只有一張大表是cstore,其餘都是普通pg表)

最後效果比greenplum和postgresql都慢了N倍(無論是否壓縮,10/11均如此),可能不太適合咱們的場景(官網的場景和上面網上的都是單表統計)。post

附protobuf-c源碼安裝過程:
https://github.com/protocolbuffers/protobuf
下載2.6.0,而後正常編譯。
tar zxvf protobuf-2.6.0.tar.gz
cd protobuf-2.6.0
./configure --prefix=/usr/  #必須在/usr下,不能/usr/local,不然最後install會提示必需要以/usr/lib結尾
make
sudo make install/etc/ld.so.conf 中添加一行: /usr/lib,保存退出
/sbin/ldconfig -v
export PKG_CONFIG_PATH=/usr/local/lib/pkgconfig #這一步不執行會提示找不到protobuf
https://github.com/protobuf-c/protobuf-c/releases下載1.2.1,大多數要求protobuf 2.6.0以上。./configure --prefix=/usr/localmake & make install這樣就安裝完成了,只是最後報了上面的錯誤。
相關文章
相關標籤/搜索