今天先來作一個簡單的kettle的例子。sql
打開輸入,選擇CSV文件輸入。數據庫
雙擊CSV文件輸入圖標,能夠看見以下:測試
步驟名稱:就是你這一步的名字,能夠任意取,原則就是要明白,清楚這一步是作了什麼操做。3d
文件名:是你要選取的這個.CSV結尾的文件的名稱。日誌
列分隔符:每一個CSV文件都是有必定的規則的,要麼是分號是分隔符,要麼是逗號是分隔符等等。orm
包含列頭行:這個是針對你的這個CSV是否具備表頭,若是有就勾上,不然他就把第一行的表頭當成數據導入了。blog
這樣選擇一個CSV格式的文件以後就能夠了,接下來點擊一下獲取字段,獲得以下圖所示:io
點擊一下預覽,會提示要預覽的行數沒輸入你要預覽的行數就好了。form
以上就是預覽的內容了。transform
以後點擊肯定就OK了。
以後再來講說輸出的操做。
此次輸出的操做咱們選擇的是MySQL數據庫,首先須要文件---->新建------->數據庫鏈接。
填寫上基本的數據庫信息就OK了,點擊測試出現
說明你的連庫信息是正確的,點擊肯定就能夠了。這一步的鏈接數據庫只是針對於這個裝換的。對於其餘轉換咱們須要從新制定數據庫!
雙擊表輸出:
數據庫鏈接就是咱們剛纔建立的數據庫鏈接,若是不是咱們想要的,能夠另外再建立一個鏈接。
目標數據庫若是沒有建立的話,咱們能夠先寫一個名字,而後再點擊SQL,就出現了一個執行建立的sql的界面:
裏面有些字段的類型是能夠改的,改爲你須要的字段的類型。以後點擊執行就好了。這一次咱們再查看一下咱們數據庫裏面的表,就有字段了。
下面咱們點擊Run,
輸出日誌以下:
步驟度量以下:
以前表裏面有2823個數據,因此這一次執行成功了!
可是!!!
這裏面有一個問題,咱們能夠再Run一下這個轉換,發現又導入了2823條記錄。再來看看數據庫裏面的數據:
納尼,怎麼是5646???
怎麼解決???
這中間是須要一個過濾的操做的,基本的思想就是:ID同樣的就是Update,ID不同的就是插入就去就能夠了。
這就須要另一個輸出的功能了,就是插入/更新。
在這裏面設置須要過濾的條件就能夠了。
至此一個transformation就能夠了。