可能面臨的問題有:
大客戶共享帳號,行爲數據可能不許,經過機器+人工的方式,要麼去掉這部分的樣本集,要麼只取大客戶本人的行爲樣本集(可是若是用戶的ip不許怎麼辦),要麼忽略
大客戶可能玩過多個區服,只取充值最多的區服
爲何要精確到區服呢?由於玩家是在區服裏玩的,玩家的單位是區服,爲了真實反映玩家的行爲規律,因此咱們也要精確到區服。數據項裏須要的聊天信息的個數、登陸時間等,都是以玩家充值最多的區服的數據爲準
遊戲合服後,須要特別注意計算其餘數據時,區服數據的過渡(從哪裏獲取合服時間數據呢?人工能夠,查看公告)
數據項以下 遊戲
用戶基本屬性
qid
充值總額
性別
年齡
省市(充值最多的地區)
登陸過幾個區服
主打區服(充值最多的區服)
QQ
角色屬性
等級
角色職業
社交屬性
好友數量
相關聊天信息個數
本身發送的負面信息個數(罵遊戲、罵客服、罵玩家、不玩了等)
公會地位
論壇發言(難獲取,可捨棄)
客服投訴
活躍屬性
首次登陸時間
最後一次登陸時間
生命長度
最後一次保持在每週三天登陸頻率的登陸時間(看最後一次活躍的登陸時間)
最後一次在充值省市內登陸的時間
是否已經流失
登陸ip省市個數
是否存在帳號共享
(對可能原主流失後 送人的帳號 能夠進行人工過濾)
第n周:
登陸天數
平均每日首次登陸時間段(小時)、首次登陸小時的方差
末次登陸的平均時間段、末次登陸的小時差
(遊戲內活躍任務完成率)
充值屬性
第n周:充值總額、充值頻率
首充金額
單筆最大充值
單筆最小充值額度
橫向影響屬性
表示的是遊戲玩家的羣體行爲可能會影響單個玩家的行爲,如下幾項都是大客戶所在區服的總體數據
第n周的:
活躍玩家的數量
付費狀況
聊天信息條數
客服系統的投訴量
遊戲產品自身屬性
須要跟用戶數據分開
第N周:
遊戲是否更新
更新質量打分ip