公司分派了一個活,預測景區將來的一段時間銷量,目的...html
一據說作預測,很興奮,當時真的沒有太考慮目的!老大也很高興,說讓我作一個景區將來天天的銷量數據,供其餘項目無限使用!機器學習
對本身說:「第一次作預測,先向外看當作熟的經驗,不要瞎琢磨」學習
美團的技術博客:http://tech.meituan.com/mt-mlinaction-how-to-ml.htmlspa
機器學習:http://my.oschina.net/airship/blog/387006?fromerr=3CBkR8Jd.net
各類準備以後,以爲景區預測須要使用:線性迴歸和時間序列。3d
最近7天、最近30天、去年同期銷售額、各類預測數據與真實數據的差距(方差),最終產出了初版結果,準確率30%htm
經歷打擊以後,發現本身有些偏離軌道,回到初始需求,按照產品給的模型一步一步開發。下面是模型圖:blog
看不清也沒有關係,預測的結果很不理想,由於很複雜&計算成本高,惟一佩服本身的是居然開發出來了,準確率:50%ip
經歷了上面的輪番打擊,本身日夜加班三週居然沒有出結果,很沮喪,準確率若是不到50%預測就沒有意義了!不如不預測,爲何預測的還不如不預測的感知的準確?開發
因而盯着屏幕,看趨勢,發現每週的數據很相近,總結規律:周+節假日,時間平移便可。因而總結中國的節假日,近期平移上週的數據,遠期平移去年的數據,結果平均準確率:80% 淚奔了!
總結:不必上來就時間序列、線性迴歸、搞機器學習啥的,不如看看趨勢圖,雖然看起來很low,可簡單&實用!
惟一值得分享的是節假日的數據表,很費時間,不過特定場合很實用: