咱們能夠集成crate 到streamsets 中能夠實現強大的數據導入,數據分析能力。
演示的是進行csv 文件的解析並輸出到cratedbhtml
環境使用docker && docker-composegit
version: "3" services: sets: image: streamsets/datacollector volumes: - "./ms/data:/data" - "./ms/logs:/logs" - "./ms/tmp:/tmp" ports: - "8000:8000" - "18630:18630" crate: image: crate ports: - "4200:4200" - "4300:4300" - "5432:5432"
docker-compose up -d
我已經放到github 項目的data 目錄github
參考地址: https://bintray.com/crate/crate/crate-jdbc/view/files/io/crate/crate-jdbc-standalone
我已經放到github 項目 的data 目錄docker
https://www.streamsets.com/documentation/datacollector/sample_data/tutorial/nyc_taxi_data.csv
使用ui 的external library 加載ide
CREATE TABLE taxi ( hack_license STRING, medallion STRING, total_amount FLOAT, tip_amount FLOAT );
問題比較多,主要是用戶帳戶以及健康檢查,鏈接池相關的,通過測試我使用了用戶認證,使用默認的crate,參考下面的圖便可
crate 官方的文檔參考會有問題測試
密碼隨意,用戶爲crate
ui
在jdbc 配置中問題比較多,記得經過校驗,逐步排除便可。3d
https://crate.io/docs/crate/guide/en/latest/tools/streamsets.html
https://github.com/rongfengliang/streamsets-demos/tree/master/cratedbcode