PHP試題---文件1T大小數據按行存儲取出重複最多的top10(運行內存有限制)

最近有去Testin(雲測)公司面試,有問到一個關於大文件處理的一個問題,具體問題以下:文件大小1T左右,運行內存100M,文件中有可能有重複數據,如今的需求就是取出文件裏面重複數最高的top10。程序員 我一開始給出的是理想狀態下的解決方案,就是這個文件中有大量重複的數據,按着這個思想來搞的話,那我確定是在運行內存足夠的狀況下來屢次讀取這個文件,以後就是標記每行值的重複次數,至於這個處理出來的數
相關文章
相關標籤/搜索