用Spark和DBSCAN對地理定位數據進行聚類

機器學習,特別是聚類算法,可以用來確定哪些地理區域經常被一個用戶訪問和簽到而哪些區域不是。這樣的地理分析使多種服務成爲可能,比如基於地理位置的推薦系統,先進的安全系統,或更通常來說,提供更個性化的用戶體驗。 在這篇文章中,我會確定對每個人來說特定的地理活動區域,討論如何從大量的定位事件中(比如在餐廳或咖啡館的簽到)獲取用戶的活動區域來構建基於位置的服務。舉例來說,這種系統可以識別一個用戶經常外出吃
相關文章
相關標籤/搜索