INFA Transformation組件

Router
Router和Filter很類似,Router能夠用一或多個Filter來取代,不一樣的是用Router來生成多個組時輸入數據只需處理一次,因此效率更高;
Router 由一個輸入組,一到多個用戶定義的輸出組和一個默認組組成,每個用戶定義的輸出組含一個測試條件,知足條件的輸入數據會進入相應的用戶定義組,不知足全部用戶定義條件的數據會進入默認組;
輸入組和輸出組的端口類型和名稱相同;
Powercenter根椐鏈接的用戶定義輸出組的順序來進行評估,若是默認組沒有鏈接,則不評估那些沒有鏈接的用戶定義輸出組;
若是某一行符合多個輸出組的評估條件,則出如今多個組的輸出數據流中;
能夠將一個輸出組的端口連到多個Transformation或者Target上,但不能將多個輸出組的端口連到一個Transformation或者Target上;
  Sorter服務器

Sorter用來排序數據,能夠指定多個排序端口,每一個端口能夠指定升降序,字符串比較時能夠忽略大小寫,還能夠用Distinct選項來消除重複(全部端口,包括沒有指定排序的端口);
排序時會用到輸入數據兩倍大小或者更大的空間,默認的排序Cache是8M,可選的排序Cache範圍是1M到4G,排序Cache不夠時,服務器會將數據臨時存儲在排序目錄,若是指定的排序Cache沒法知足,會話會失敗,能夠用文檔中提到公式計算Cache;
當配置使用 Distinct屬性時,全部的端口都會用於排序;
默認狀況下,NULL大於任何值,能夠配置NULL值小於任何值;
  Union函數

Union能夠將多個數據流合併成一個數據流,功能相似於SQL中的UNION ALL;
Union能夠有多個輸入組,只有一個輸出組,輸入組和輸出組有一一對應的端口;
Ports 頁不可編輯,只能編輯Groups 和 Group Tabs頁;
 Rank測試

Rank能夠用來返回根椐某個端口排序的最大或者最小的N條記錄,而且能夠指定分組;能夠用於獲得去除的重複資料(好比5條相同數據,只取了一條,那麼另外四條能夠由這個加上Sqerence組合獲得其它四條.).
Rank中可使用分組,但並不能使用分組函數,能夠指定多個分組端口,但用於排序的Rank端口不可用於分組;
Rank端口有五種屬性:I(輸入),O(輸出),V(變量),R(排序),G(分組),至少須要有一個輸入端口和一個輸出端口,排序端口有且只有一個,並且必須輸出,排序端口和變量端口不能用於分組;
輸入端口的數據只能來自一個Transformation;
有一個默認的Rankindex端口,表示輸出行在排序中的位置;
若是是字符排序,能夠選擇大小敏感或者大小寫不敏感;
Top X 中的X數量表示前幾條數據(Rankindex的值就是順序),當Rankindex同樣時,取其中部分,好比Top1,有兩條記錄的Rankindex爲1,則取其中一條.其受cache限制,可按需調整cache.
---------------------
做者:吃魚的羊
來源:CSDN
原文:https://blog.csdn.net/hellojoy/article/details/46741917?utm_source=copy
版權聲明:本文爲博主原創文章,轉載請附上博文連接!.net

相關文章
相關標籤/搜索