pentaho之kettle篇---kettle基本操做

 

 

 

 

今天先來作一個簡單的kettle的例子。sql

打開輸入,選擇CSV文件輸入。數據庫

雙擊CSV文件輸入圖標,能夠看見以下:測試

步驟名稱:就是你這一步的名字,能夠任意取,原則就是要明白,清楚這一步是作了什麼操做。3d

文件名:是你要選取的這個.CSV結尾的文件的名稱。日誌

列分隔符:每一個CSV文件都是有必定的規則的,要麼是分號是分隔符,要麼是逗號是分隔符等等。orm

包含列頭行:這個是針對你的這個CSV是否具備表頭,若是有就勾上,不然他就把第一行的表頭當成數據導入了。blog

這樣選擇一個CSV格式的文件以後就能夠了,接下來點擊一下獲取字段,獲得以下圖所示:io

點擊一下預覽,會提示要預覽的行數沒輸入你要預覽的行數就好了。form

以上就是預覽的內容了。transform

以後點擊肯定就OK了。

以後再來講說輸出的操做。

此次輸出的操做咱們選擇的是MySQL數據庫,首先須要文件---->新建------->數據庫鏈接。

 

 填寫上基本的數據庫信息就OK了,點擊測試出現

說明你的連庫信息是正確的,點擊肯定就能夠了。這一步的鏈接數據庫只是針對於這個裝換的。對於其餘轉換咱們須要從新制定數據庫!

 雙擊表輸出:

數據庫鏈接就是咱們剛纔建立的數據庫鏈接,若是不是咱們想要的,能夠另外再建立一個鏈接。

目標數據庫若是沒有建立的話,咱們能夠先寫一個名字,而後再點擊SQL,就出現了一個執行建立的sql的界面:

裏面有些字段的類型是能夠改的,改爲你須要的字段的類型。以後點擊執行就好了。這一次咱們再查看一下咱們數據庫裏面的表,就有字段了。

下面咱們點擊Run,

輸出日誌以下:

步驟度量以下:

以前表裏面有2823個數據,因此這一次執行成功了!

可是!!!

這裏面有一個問題,咱們能夠再Run一下這個轉換,發現又導入了2823條記錄。再來看看數據庫裏面的數據:

納尼,怎麼是5646???

怎麼解決???

這中間是須要一個過濾的操做的,基本的思想就是:ID同樣的就是Update,ID不同的就是插入就去就能夠了。

這就須要另一個輸出的功能了,就是插入/更新。

在這裏面設置須要過濾的條件就能夠了。

至此一個transformation就能夠了。

相關文章
相關標籤/搜索