pslite技術內幕(一):理論篇

介紹 分佈式的優化和推斷已經成爲解決大數據機器學習問題的重要問題。由於數據規模的不斷增長,以及越來越複雜的模型(表現在模型參數的不斷增長)的提出,單機已經無法有效的解決這些問題。實現高效分佈式的算法並不容易,密集的計算負載和大量的數據通信都需要精心的系統設計。 現實訓練數據的規模可能再1TB和1PB之間。模型的參數的個數在 1 0 9 10^9 109到 1 0 10 10^{10} 1010之間
相關文章
相關標籤/搜索