Spark實戰電影點評系統(一)

一、通過RDD實戰電影點評系統   日常的數據來源有很多渠道,如網絡爬蟲、網頁埋點、系統日誌等。下面的案例中使用的是用戶觀看電影和點評電影的行爲數據,數據來源於網絡上的公開數據,共有3個數據文件:uers.dat、ratings.dat和movies.dat。   其中,uers.dat的格式如下: UserID::Gender::Age::Occupation::Zip-code ,這個文件裏共
相關文章
相關標籤/搜索