kettle——入門操做(轉換之-去除重複記錄,字段選擇)

兩個控件,去除重複記錄,Unique Rows(HashSet),以及字段選擇,以下spa

一、去除重複記錄,要求按照去除重複列進行排序才行3d

  

  Data GRid 輸入信息,按照以下,及去除重複記錄的要求,按照flag去除重複記錄,只會有四條記錄blog

    

  去除重複記錄設置,排序

    

  結果輸出,只輸出了四行hash

    

二、Unique Rows(hashset),這個空間不須要進行排序配置

    

  Data GRid 輸入信息,按照以下,及去除重複記錄的要求,按照flag去除重複記錄,只會有三條記錄im

      

  
  Unique Rows(HASHSET)設置以下d3

    

   結果輸出,數據

    

 

 三、字段選擇規範化

    

    字段選擇配置界面以下,前兩個選擇和修改及移除選項卡,功能差很少,一個是選擇字段輸出,一個是選擇字段不輸出。

      元數據是對字段名稱長度及類型等的規範化。

      

 

 四、排序記錄控件,功能是根據指定字段進行排序

            去重

    

  Data Grid 2 輸入流,

     

  排序設置,

     

  輸出結果

    

相關文章
相關標籤/搜索