遍歷複用

減少外存(硬盤)訪問量一直是提高大數據計算性能的永恆話題,我們也討論過列存、壓縮等直接減少訪問量甚至存儲量的手段。除了這些存儲層面的方法外,在算法和計算實現環節,也可以想辦法減少外存的訪問量。 遍歷是大數據計算中必不可少的環節。有時候,我們會發現在一個計算任務中,會有兩次(或更多)涉及針對同一批數據的遍歷動作。如果我們能有辦法讓兩次遍歷合併成一次,那麼總的計算量(CPUT 的動作)並沒有差別,但硬
相關文章
相關標籤/搜索