阿里音樂預測小結2——藝人週期規律

根據小結1,用複賽數據對藝人分類爲高播放量 (前23名) 藝人和低播放量藝人:
以08均值最高的藝人1b322374de83520bf45aa8928e18e70a爲研究對象
選擇七、8月畫出時序圖,除了7月初(7月7日)前,以後基本是平穩的。
   按每週7天計算每個月平均播放量以下,能夠發現這個分佈規律與工做節假日規律相關
 
根據以前金陵書生提供的聽歌年齡分佈,大概在25到31歲所佔比重最大,這類人大部分是上班族,所以每日聽歌習慣就是和上班習慣掛鉤,符合以下上班族規律:
周1,2好好工做精神飽滿
週三、4疲勞成極寫不進去
周5快要節假再恢復精神工做一點
週六、7逛街玩耍休息Hi起來

根據上圖,因爲大部分人聽歌是用來放鬆的,也就是說最疲勞的時候(週三)最須要放鬆,此時聽歌人數劇增,而週六、7節假日相對放鬆活動選擇不少,聽歌人數反而很少。這個就是上個小結觀察出來的每日用戶人數的週期規律。而至於人均點播量規律,這個週期性不強,主要在因而否是粉絲用戶。由此能夠按照工做日和節假日來區分,很明顯七、8月每月都是節假日要比工做日低一些:
 接下來,畫出3月到8月每月的工做日和節假日對比圖,能夠發現每月工做日之間節假日的差值是不一樣的,好比3月的工做日和節假日基本持平,四、五、6月基本一致,七、8月基本一致,這是爲何?
 分析: 畫出它從3到8月時序圖以下,發現3月上升,四、五、6月基本平穩,6月末陡升,七、8月在新略升高的地方平穩,整體趨勢在七、8月後有升高一個小臺階。按照常理節假日老是比工做日高,可是當某個月(3月)是攀升階段(點播量上升),則 節假日 的播放量可能會大於等於 工做日,而當某個月(四、7月)出現劇增現象且數值還不算很大,此時單個劇增並無影響工做日大於節假日。
 



  • 正例:用排名第3的藝人2dc8d3a917b12e65d4695e2277dd4943對應的圖表驗證以上分析,分別畫出時序圖和每個月工做日、節假日平均播放量:
從圖中看出每一個 工做日的播放量都小於節假日,其中5月最明顯,而6月工做日節假日基本一致
 分析時序圖發現,三、4月在攀升,5月有陡升,且值很是大,6月開始降低,降到月末,7月緩慢升,8月緩慢升。由於每月基本都在攀升,所以節假日大於工做日, 而6月有降低工做日節假日基本一致了。


 
  • 反例: 用排名第23的藝人9ff7ca7b2c9e53902ac956da5cb5bcda對應的圖表驗證以上分析,分別畫出時序圖和每個月工做日、節假日平均播放量:
從圖中看出每一個工做日的播放量都小於節假日,其中4月最明顯,而6月工做日節假日基本一致
 從時序圖看出三、4月在攀升,且4月出現陡升值,可是月末下降,5月攀升,六、七、8各自平穩
再看它的月按周統計播放量:發現反常尤爲是在七、8月平穩時依然是週日最高,這有多是歌手的音樂適合週末聽,好比旅行聽的豪放一點的歌。考慮從新對歌手按工做日和節假日比例進行分類。


 出現反例,此時有必要從新考慮對藝人分類,分類方式按照工做日和節假日規律進行:在算法平臺使用k均值聚類對100個藝人6個月工做日、節假日均值以及比例數據(表:ly_weeks_percent)進行分類,結果以下,基本是對半分類。其中聚類1index=0;聚類2index=1.
這個第二類就是明顯的值聚在了一塊兒!(53個數據)
 
 聚類後並無用上。
 


 
 


相關文章
相關標籤/搜索