海量數據排序

海量數據排序 一、外部排序 海量數據不能一次性讀入內存,在對海量數據進行排序時,首先需要將海量數據拆分到多臺機器或者多個文件,這些機器或文件稱爲拆分節點;然後在每個拆分節點上將數據全部讀入內存並使用快速排序等方法進行排序;最後在合併節點使用多路歸併方法將所有拆分節點的部分排序結果整合成最終的排序結果。外部排序也可以被稱爲外部歸併排序。 如果不進行額外處理,合併節點仍然無法將所有數據讀入內存中。可以
相關文章
相關標籤/搜索