項目背景
FBP項目全稱FootBallPrediction,歷經9個月完成的足球比賽預測項目。項目結合大數據+機器學習,不斷摸索開發了一款軟件。軟件根據各大博彩公司賠率多維度預測足球比賽結果(包含勝和不勝)。機器學習用的是本身創建的「三木板模型」算法,已在國家期刊發表論文並被萬方數據庫收錄(三木板模型算法論文地址:網頁連接 搜索「基於機器學習的預測算法模型及其在環評領域的應用」)。目前準確率可達80%。目前軟件版本爲14.0。FBP項目在Github網站已經有超過80人關注(網頁連接),並在本身建立的微信羣裏已經吸引了不少人,而且天天均有部分人根據預測結果參考投注競彩,參考的人都得到了相應的收益。如今想經過認識更多的有識之士,一塊兒探索如何將項目作大作強,找到合夥人,實現雙贏。
技術實現(完整可下載開源代碼:網頁連接)
數據清洗
一、只抓取主隊爲讓球方(上盤)的場次,保證數據具備一致性。
二、只抓取主隊勝賠,做爲影響因子。
三、過濾掉蚊子肉,將Oddset<1.45或偉德<1.45的場次過濾掉。
機器學習
FBP項目中的核心模型:三木板模型(參考萬方數據庫論文),即任意選取三家菠菜公司的賠率做爲組合對象與歷史數據的三家比較,統計出歷史數據標籤y/n(勝/不勝)的數量,並輸出符合條件「y>n*3或n>y*3」的結果(3爲參數,目前還沒有調整過此參數,可根據算法模型及評估結果適時調整)。此結果做爲選擇信心場次的依據。
其他KNN、bagging、反向傳播等算法參考詳細設計書。
評估模型
用正向激勵和反向激勵統計出哪些組合對比賽結果有較大的影響,做爲從此選擇信心場次的優先依據。
優點
準確率高,達到80%左右不斷更新預測模型的數據,隨着歷史數據的不斷更新,不斷迭代修正原始模型,符合機器學習中的反向傳播算法理論,準確率會不斷提升,並穩定在高準確率不受我的情緒影響,徹底由程序輸出看好的比賽對比同行公衆號推薦:大多數都是人爲看盤口,如今是人工智能時代,一定被機器學習淘汰。別的公衆號推籃球、足球,足球還推讓2球,大小球,角球,能有那麼多精力,很難相信作的專業。甚至還有推薦讓平讓負雙選,最後仍是預測錯誤。FBP程序只預測主隊爲上盤的比賽,只推勝或不勝(也就是讓負),簡約而不簡單。高賠率優點,賠率通常在1.8-2.2之間。最重要的一點:程序給出當天預測的信心指數,徹底數據量化的數值,根據指數的大小分配投資金額。目前三次>9.0的所有命中。時間早,能夠提早1天作出程序預測不受操盤手影響,無視盤口的變化預測模型是一個「歷史賠率組合不斷迭代修正」的過程,符合機器學習中的反向傳播算法理論,以大數據賠率組合狀況產生的結果作預測系統化的方式描述預測規則,處理歷史數據,觀察預測在過去的表現如何,進而根據具體結果合理的改進這些預測規則還會結合新的規則、程序目前可能忽略的預測規則(如程序1.0版本只考慮了各大菠菜公司的賠率,程序2.0就增長了聯賽的維度,程序3.0又增長了階段性數據做爲新的預測規則),此時的程序預測能力就提升了不少,更精確、更快、更不受情緒干擾並非盲從程序的建議,而在程序預測的同時,本人也進行分析(結合基本面尤爲是歷史交鋒),而後對兩者進行對比。當程序的決策與我不一樣,我會追溯緣由並總結。
技術支持
Github網站:網頁連接
Kaggle網站:網頁連接
微信號:acredjb
公衆號:AI金膽git