參數服務器——分佈式機器學習的新殺器

轉載自:數據極客 在大規模數據上跑機器學習任務是過去十多年內系統架構師面臨的主要挑戰之一,許多模型和抽象先後用於這一任務。從早期的MPI,到後來的Hadoop,乃至於目前使用較多的Spark,都曾被廣泛應用於大規模機器學習處理任務。John Langford曾經在他的博客(機器學習領域最好的博客之一)上總結和對比了主流的分佈式機器學習框架的抽象[1]: MPI Gradient Aggregati
相關文章
相關標籤/搜索