streamsets 有一個directory的origin 能夠方便的進行文件的處理,支持的格式也比較多,使用簡單html
由於使用的是容器,會有數據copy 容器的一步git
容器id 結合實際查詢: docker cp data/ containerid:/data/excel
https://github.com/rongfengliang/streamsets-demos
https://streamsets.com/documentation/datacollector/latest/help/datacollector/UserGuide/Origins/Directory.html#concept_qcq_54n_jqgithub