從0開始學pyspark(十):使用pyspark.ml.clustering模塊對商場顧客聚類

數據下載: 數據爲kaggle上的關於商場客戶的數據,地址:https://www.kaggle.com/vjchoudhary7/customer-segmentation-tutorial-in-python 數據準備: 數據集很小,四個特徵值:性別,年齡,收入能力,消費能力,這裏我們用收入能力和消費能力兩項對客戶進行聚類處理 from pyspark.sql import SparkSess
相關文章
相關標籤/搜索