Spark面試精選題(05)

一、簡答說一下hadoop的map-reduce編程模型 首先map task會從本地文件系統讀取數據,轉換成key-value形式的鍵值對集合使用的是hadoop內置的數據類型,好比longwritable、text等將鍵值對集合輸入mapper進行業務處理過程,將其轉換成須要的key-value在輸出以後會進行一個partition分區操做,默認使用的是hashpartitioner,能夠經過
相關文章
相關標籤/搜索