ETL工具-KETTLE教程實例實戰3----轉換(輸入、輸出)

一個做業至關於一次執行的全過程,而每一個做業是由許多的轉換和做業組成,下面咱們先跳過做業和數據庫鏈接直接先講抓換:html

轉換同時也是有許多的各類控件組成,下面咱們就先來介紹下經常使用控件的使用,再舉例說明下經常使用控件的使用:mysql

1、轉換

一、輸入

1.一、表輸入:鏈接數據庫(oracle、mysql、DB2,infomix,sqlserver),根據sql語句查詢相關數據,放入數據流

 

 

 

 

 

 具體步驟:按照上圖順序:一、配置數據庫鏈接;二、填入具體的sql語句;三、預覽查詢數據是否正確展現;四、點擊肯定保存控件修改web

 

 

 

 預覽數據的數據內容。sql

1.二、JSON輸入:讀取文件中的Json數據,放入數據流,該數據流支持寫入數據庫表和文件

 

 

 js文件如上圖,3個對象,包含id、name、sex和age數據庫

 

 

 

 

 

雙擊打開json輸入,如上圖所示添加文件,選擇字段後,點擊肯定便可導入json數據,轉換爲具體的表數據流,點擊預覽能夠看到轉換後的具體數據,以下圖:json

 

 

 

 

 

 1.三、JSON輸入:讀取文件中的xml報文數據,寫入數據流,該數據流支持寫入數據庫表和文件

 

 

 

 雙擊打開xml文件輸入,如上圖所示添加文件,選擇字段後,點擊肯定便可導入xml報文數據,轉換爲具體的表數據流,點擊預覽能夠看到轉換後的具體數據,該數據能夠寫入文件或數據庫表oracle

 

 1.四、文本文件輸入:讀取文本文件中的據,寫入數據流,該數據流支持寫入數據庫表和文件工具

 

 

 

 

 

  雙擊打開文本文件輸入,如上圖所示添加文件,選擇字段後,點擊肯定便可導入txt數據,轉換爲具體的表數據流,點擊預覽能夠看到轉換後的具體數據,該數據能夠寫入文件或數據庫表sqlserver

 

二、輸出

2.一、EXCEL輸出:將數據流中的文件輸出到EXCEL

 

 

   此處用到兩個控件,文本文件前面說過,能夠觀看前面的內容。選擇excel輸出後,按住shift鍵,鏈接兩個控件(HOP連線)。spa

   雙擊打開EXCLEL輸出,如上圖所示添加文件,選擇字段後,點擊肯定便可導出excel數據,Integer數據的格式要選擇0,爲整型,否則導出的id爲1.00,帶出的文件內容以下:

 

 

 

 2.二、XML文件輸出:將數據流中的文件輸出到XML中

 

 

 

   此處用到兩個控件,文本文件前面說過,能夠觀看前面的內容。選擇excel輸出後,按住shift鍵,鏈接兩個控件(HOP連線)。

   雙擊打開XML文件輸出,如上圖所示添加文件,選擇字段和該字段是元素仍是屬性後,點擊肯定便可導出XML,Integer數據的格式要選擇0,爲整型,否則導出的id爲1.00

 

 2.二、JSON文件輸出:將數據流中的文件輸出到XML中

 

 

 

 

 

    雙擊打開JSON輸出,如上圖所示填寫XPATH,選擇字段後,點擊肯定便可導出json數據。

 

 2.三、刪除:此處再也不贅述,後面講解執行sql腳本比刪除更方便

 

 2.四、SQL文件輸出:此處再也不贅述,PLSQL、TOAD,NATIVE等IDE工具導出會更加方便

 

 2.四、表輸出:將數據流中的文件輸出到數據庫的具體表中

 

 

 

 

 

   此處用到兩個控件,文本文件前面說過,能夠觀看前面的內容。選擇表輸出後,按住shift鍵,鏈接兩個控件(HOP連線)。

   雙擊打開表輸出,如上圖所示配置好數據庫,選擇具體的表,執行轉換,便可插入具體的數據庫表。運行結果以下:

 

 

 2.四、表輸出:將數據流中的文件輸出到數據庫的具體表中

 

 

 雙擊打開插入/更新,如上圖所示配置好數據庫,選擇具體的表,按照1-3步驟配置,執行轉換,便可插入/更新具體的數據庫表。

**讀取上個步驟的數據,放入數據流中,ID相同會執行更新操做,ID不存在會執行插入操做

 

在這給你們介紹完了,轉換中經常使用的輸入輸出,經過上述介紹能夠看到,kettle功能十分強大,能夠直接讀取文本、JSON和XML數據,與數據庫作交互等。這還只是KETTLE的很小一部分功能。

 

 

 

歡迎關注公衆號,回覆「教程」獲取程序源代碼,獲取例子源碼,掃描下方二維碼加關注

 

原文出處:https://www.cnblogs.com/dalaba/p/12099089.html

相關文章
相關標籤/搜索