如何基於Spark進行用戶畫像?

近期,comSysto公司分享了該公司研發團隊利用Spark平臺解決Kaggle競賽問題的經歷,爲Spark等平臺應用於數據科學領域提供了借鑑。 主辦方提供了一個包含5萬個匿名駕駛員線路的數據集,競賽的目的是根據路線研發出一個駕駛類型的算法類簽名,來表徵駕駛員的特徵。例如,駕駛員是否長距離駕駛?短距離駕駛?高速駕駛?回頭路?是否從某些站點急劇加速?是否高速轉彎?所有這些問題的答案形成了表徵駕駛員特
相關文章
相關標籤/搜索