《Scala機器學習》一一3.3 應用

3.3 應用 下面會介紹Spark/Scala中的一些實際示例和庫,具體會從一個非常經典的單詞計數問題開始。 3.3.1 單詞計數 大多數現代機器學習算法需要多次傳遞數據。如果數據能存放在單臺機器的內存中,則該數據會容易獲得,並且不會呈現性能瓶頸。如果數據太大,單臺機器的內存容納不下,則可保存在磁盤(或數據庫)上,這樣雖然可得到更大的存儲空間,但存取速度大約會降爲原來的1/100。另外還有一種方式
相關文章
相關標籤/搜索