據介紹,cstore_fdw實現了 PostgreSQL 數據庫的列式存儲。列存儲很是適合用於數據分析的場景,數據分析的場景下數據是批量加載的。
這個擴展使用了Optimized Row Columnar (ORC)數據存儲格式,ORC改進了Facebook的RCFile格式,帶來以下好處:
壓縮:將內存和磁盤中數據大小削減到2到4倍。能夠擴展以支持不一樣壓縮算法。
列投影:只提取和查詢相關的列數據。提高IO敏感查詢的性能。
跳過索引:爲行組存儲最大最小統計值,並利用它們跳過無關的行。html
其實官方自測性能也最多就提高了1倍,大多數在10%到50%之間(這裏也有一個測試:http://blog.chinaunix.net/uid-20726500-id-4325901.html,不過LZ是根據實際生產場景進行的)。趁着假期對比各基於SQL的數據庫平臺,順帶測一下。git
注:pg目前自己沒有列式存儲特性(只有基於pg的純粹列式模式pg),卻是有提交的patch,能夠參考https://yq.aliyun.com/articles/691878,可是沒有被合併。github
從https://github.com/citusdata/cstore_fdw下載最新版本,例如cstore_fdw v1.6.1,支持pg 11.5。算法
安裝protobuf-c,以下:sql
一開始某臺測試機器由於不能訪問外網,下載了yum install protobuf-c-develprotobuf-c-compiler和protobuf源碼進行安裝。好不容易安裝好了,可是最後安裝cstore_fdw自己時,遇到Unrecognized syntax identifier "proto3". This parser only recognizes "proto2"(這裏有個未經驗證的解決方法:https://blog.csdn.net/AmbitiousRuralDog/article/details/80774518),罷了,最後仍然回去使用yum安裝了。
而後編譯cstore_fdw便可。以下:
postgresql.conf中增長shared_preload_libraries 配置,以下:
shared_preload_libraries = 'cstore_fdw' # (change requires restart)
測試:
數據庫
-- load extension first time after install CREATE EXTENSION cstore_fdw; -- create server object CREATE SERVER cstore_server FOREIGN DATA WRAPPER cstore_fdw;
-- 建立測試表,具體能夠參考github官網
CREATE FOREIGN TABLE xxx_FDW
(
-- 字段列表
)
SERVER cstore_server
OPTIONS(filename '/disk01/cstore/xxx_FDW.cstore',compression 'pglz');ide
-- 執行SQL(多表關聯,只有一張大表是cstore,其餘都是普通pg表)
最後效果比greenplum和postgresql都慢了N倍(無論是否壓縮,10/11均如此),可能不太適合咱們的場景(官網的場景和上面網上的都是單表統計)。post
附protobuf-c源碼安裝過程:
https://github.com/protocolbuffers/protobuf
下載2.6.0,而後正常編譯。
tar zxvf protobuf-2.6.0.tar.gz cd protobuf-2.6.0 ./configure --prefix=/usr/ #必須在/usr下,不能/usr/local,不然最後install會提示必需要以/usr/lib結尾 make sudo make install 在/etc/ld.so.conf 中添加一行: /usr/lib,保存退出 /sbin/ldconfig -v
export PKG_CONFIG_PATH=/usr/local/lib/pkgconfig #這一步不執行會提示找不到protobuf
https://github.com/protobuf-c/protobuf-c/releases下載1.2.1,大多數要求protobuf 2.6.0以上。./configure --prefix=/usr/localmake & make install這樣就安裝完成了,只是最後報了上面的錯誤。