大數據常用組件流程

MR 1.MapTask調用Inputformat方法創建一個RecordReader RecordReader以此調用nextkeyvalue getcurrentkey getcurrentvalue方法 獲取<K,V>傳遞給Mapper類,每讀取一行數據就會調用一次map方法,然後將 通過邏輯處理後的<K,V>輸出到OutputCollector 2.Collector將數據緩存到環形緩衝區
相關文章
相關標籤/搜索