用Spark分析Amazon的8000萬商品評價(內含數據集、代碼、論文)

儘管數據科學家經常通過分佈式雲計算來處理數據,但是即使在一般的筆記本電腦上,只要給出足夠的內存,Spark也可以工作正常(在這篇文章中,我使用2016年MacBook Pro / 16GB內存,分配給Spark 8GB內存)。 此外,通過Maxcompute及其配套產品,低廉的大數據分析僅需幾步。 亞馬遜的商品評論和評分是一個非常重要的業務。 亞馬遜上的客戶經常基於這些評論做出購買決定,並且單個不
相關文章
相關標籤/搜索