分析並統計數據量爲TB,PB級別的文檔中的數據

一. 問題描述: 假設有一個10TB大小的文本文件test.txt,文本中每一行是一個0-10000的隨機數, 如今要統計出文件中最大的1000個數字,請提出解決方案,並經過代碼實現。 二.解決方案 方案1: (1)讀取文本文件中的數據, 存入數組或者列表(列表底層是經過數組實現的)中, 將數組或者列表進行排序,取出前1000個或者後1000個數據便可。 (2)這種解決方式有缺陷嗎,數組能存下那麼
相關文章
相關標籤/搜索