非負矩陣分解算法基於hadoop streaming的實現

非負矩陣分解算法思想如下: 並行化思路: 由公式(2-8)和(2-9)可以看出,矩陣更新所需要的主要操作就是矩陣之間的乘法運算,並行化操作也主要是對乘法運算進行並行,對矩陣H的並行化步驟如下: 並行化算法設計: 針對以上的並行化流程,並行化步驟如下: 算法實現和結果: 算法採用hadoop streaming實現,矩陣採用稀疏結構進行存儲,部署在5個計算節點,每個節點爲8核心,設置的map數量爲0
相關文章
相關標籤/搜索