身爲一名剛剛踏入程序員世界的小白,剛畢業進入公司的第一個項目即是負責ETL部分的開發也就是使用開源工具Kettle(我是Java後臺方向的XD),原本就不期望給個小白分配什麼重要的業務去作,又是純圖形界面的托拉拽開發,前期自學起來真的是很無聊的。最近這個項目即將結束,準備寫個文章來整理下開發過程當中遇到的坑,第一次寫文章還請多多指教。程序員
ps:順便說一句,Kettle我用的是7.1開源版本的,開源版裏面的坑還真的不是通常的深。工具
先說說Kettle這東西,翻譯過來的意思就是水壺,很符合其做者對其的定義,將數據「倒入」到壺中,通過篩選過濾,以指定的格式輸出來。感受就想是在泡茶通常,選上好泉水,配上好茶,煮上幾分鐘,就能倒出來一杯好茶。其主要用於數據遷移、清洗即ETL過程,但Kettle還支持不少腳本語言Javascript等和不少插件,可謂是功能十分強大了,那麼有多強大呢,這麼說吧,裏面近乎三分之二的插件我都還沒用過,就完成了項目的業務,Kettle要想學深仍是有很大難度和挑戰的。插件
附一個Kettle 7.1版本的官方開發文檔地址,裏面講的仍是比較詳細的,本人英文很差就很少說了 -> Chrome -> 翻譯翻譯