Python+PySpark 做用戶畫像

一、數據準備 主要用到兩個數據文件: action.txt , document.txt 。 下表爲 action.txt ,數據格式: userid docid behaivor time ip ,即: 用戶編碼 文檔編碼 行爲 日期IP地址 下表爲 document.txt ,數據格式: docid channelname source keyword:score ,即: 文檔編碼 類別(大類
相關文章
相關標籤/搜索