前言html
本篇咱們將總結的算法爲Microsoft時序算法的結果預測值,是上一篇文章Microsoft時序算法的一個總結,上一篇咱們已經基於微軟案例數據庫的銷售歷史信息表,利用Microsoft時序算法對其結果進行了預測,而且相應造成了折線預測圖和模型依賴屬性,有興趣的同窗能夠點擊查看,可是上篇文章的能給出的只是一個描述趨勢的折線圖,從圖中咱們能分析出的知識也只能經過語言描述,而這裏面缺乏更確切的數據支撐,做爲一個凡事以數聽說話的年代顯然這是不夠的,本篇咱們將根據上一篇的預測過程詳細的給出預測結果值,造成一份可供具體參考的數據明細表。算法
應用場景介紹數據庫
做爲Microsoft時序算法的應用場景,在上一篇咱們已經詳細介紹了,本篇就再也不贅述,總結一下就是凡事要應用時間總線爲依據,根據以往歷史事例記錄推測之後將要發生的結果值,此種場景咱們都會應用到時序算法。函數
好比:預測銷售記錄、預測營業額度、預測明年公司員工人數、預測下個月房價、預測明年.....工具
但其實凡此種種咱們要挖掘的實際上是一種規律,一種事態進展中的導向,而這些可能不基於數據僅憑經驗值是作不到的或者說不許確的,凡事有因必有果,不少事情冥冥中已經註定,汗...有點佛家寓言的味道!時序算法更重要的是展示這注定的過程,而後推算出將要發生的結果。對於原本的事例就無規律可循,這種事情是用Microsoft時序算法沒法預測的,或者預測結果是不許的,好比:大師,您幫我算算我下期彩票買什麼號能中一等獎???我那個去!....汗......也能算..只是不許!...網站
技術準備spa
(1)參照上一篇文章,咱們利用微軟提供的案例數據倉庫(AdventureWorksDW2008R2),這這裏咱們只須要用到一張表,確切的說是一張視圖vTimeSeries,其實這裏面就是記錄的往年不一樣月份的銷售彙總值,稍後咱們將詳細分析這部分數據。3d
(2)VS200八、SQL Server、 Analysis Servicescode
操做步驟htm
(1)這裏咱們應用上期中時序算法的解決方案,咱們打開:
這裏上篇文章咱們已經分析的很詳細,有興趣的童鞋能夠參照上一篇文章,到此咱們來能夠驗證下該模型的準確度怎麼樣,咱們來查看「挖掘準確性圖表」
能夠看到此處爲灰色顯示,也就是說對於Microsoft時序算法模型,準確度模型是無法預測的,這也是在Microsoft全部的挖掘算法中惟一一個不能利用準確度性圖表進行驗證的,緣由很簡單:事情還沒發生,你驗證個P...
以往的挖掘模型能夠經過歷史遺留的部分事例進行驗證模型的準確度,而時序算法不行,由於你的時間維度還沒演變到此,全部的全部的都還未發生,無法驗證。固然咱們能夠採用交叉驗證根據以往的事例來驗證當前時間之前發生的事是否準確。我們後期進行....
(2)基於現有Microsoft時序算法來推測將來發生結果值
這個步驟沒啥複雜的,就是根據上篇咱們的時序挖掘模型來推測出將來將要產生的銷售額和銷售量,咱們會推測出詳細的結果值表
咱們進入「挖掘模型預測」面板
咱們選擇源爲「預測函數」,將Amount、Quantity兩個預測值拖到條件/參數窗口,而後輸入預測步驟爲5,而且將主鍵列加入或者咱們直接填寫查詢語句:
點擊運行按鈕,咱們來查看結果:
結果出現了,M200這款自行車在歐洲在2008年的銷售額和銷售量咱們已經確切的預測出來了,由於咱們只是預測了5個月,其它時間段的也能夠推測出,固然其它的產品能夠查看,此處咱們就不展開了,剩下的工做咱們將它們保存到數據庫:
咱們來查看數據庫明細:
嘿嘿...剩下的事情就是拿着這份數據去找BOSS了....而後...就而後了......
-------------------------------------------------------霸氣的分割線------------------------------------------------------------------
到此貌似本篇文章也應該結束了,可是我估計到此結束會有不少朋友罵我是標題黨,你丫的不是說要玩彩票預測嘛,丫不是說時序算法能夠預測將來的事情嘛....咋認慫了呢....
上面的應用場景中也提到了此問題...鑑於此,我懷揣着成爲「大溼」的夢想,當心翼翼的打開了百度,而後輸入了:彩票,但願從中找到點數據來瞅瞅:
看到了這霸氣的百度樂彩,並且是頭條顯示,我弱弱的點開了它,而後很仔細的看了一圈,終於在一個小角落裏找到了一個比較簡單的東西,「排列三」,嗯...就三個數是否是還好弄點,要不推測的數太多了會不會把本身搞死,嘿嘿...我打開了它,有圖有真相:
在中間一個猥瑣的地方找到了「歷史數據」,我點開了它,找的就是它:
嘿,就是它,我找到了部分歷史數據,並且裏面數據都很標準,徹底符合咱們時序預測的算法,期號咱們作主鍵,日期列也有..開獎號碼爲預測列,嘿嘿..百度作的仍是蠻可愛的!
別高興的太早,丫找到數據就牛了,這些數據隨便找個網站一大堆大堆的!
好吧,咱們低調的打開了Office的Excel軟件,而後把這些數據搞到Excel中來:
點擊導入按鈕,新建一個Sheet來存儲數據,清理掉不須要的冗餘數據,獲得標準的規範數據:
而後經過SQL Server自帶的導入工具,順利的導入到數據庫中,爲了研究好這三個數,單個數字之間有沒有關聯性,爲此我單首創建了一張表,將這三個數字拆分開來研究,但願這樣獲得的數據會準確一點點...以防被拍磚的風險,咱們來看下建庫腳本:
SET QUOTED_IDENTIFIER ON GO CREATE TABLE [dbo].[TicketResult]( [開獎日期] [datetime] NULL, [期號] [float] primary key not NULL, [開獎號碼] [nvarchar](255) NULL, [本期銷量] [float] NULL, [FirstNo] [int] NULL, [TwoNo] [int] NULL, [ThirdNo] [int] NULL ) ON [PRIMARY] GO
這個腳本很土,不少地方不標準,玩過多年數據庫的銀們不要噴我,中文字段名、沒建索引等等吧,爲了演示方便我就先湊着用着。咱們將Excel導入到庫中經過語句插入到這張表中,這過程簡單的很,咱們就不貼圖了。有問題的能夠私信我,咱們直接看結果:
數據有了,剩下的步驟就是打開咱們的解決方案,而後新建數據源,而後新建數據源視圖,而後新建數據挖掘結構,具體的詳細步驟不清楚的能夠參考我以前文章或者私信我,這裏咱們只看一下新建挖掘結構的過程當中的輸入、輸出和鍵的設置:
而後完成該模型的創建,咱們來看看此模型方案:
到此咱們的數挖掘模型已經創建完畢,而後部署下,而後處理下,咱們就能夠瀏覽結果了!
懷着沉重的心情,我悄悄的打開了「挖掘模型查看器」,結果,你懂得...
你妹呀,這是神馬?一堆亂碼...一片混沌嘛...
可是、可是我不能對不起「大溼」的稱號,我要從中找到點神馬...哪怕是一點點蛛絲馬跡..我當心翼翼的選擇了第一個數字的預測:FirstNO:
從選擇第一個數字的預測圖咱們能夠看到,歷史結果值集中在中間值,以4爲最佳值,而且以此值做爲分割點向兩側逐漸減小出現次數,而後我經過點擊順利的預測出來明天也就是2014年10月15號的第一個數字應該是4!...我去...好數字...這個數字出現機率最高,爲了給本身挽回顏面,可愛的VS也將它做爲明天最佳的預測值。
而後..而後我又看了其它數字的預測,經過上面的方法將明天的結果預測結果值保存到了數據庫,咱們來看:
咱們點擊來看運行結果:
哈哈...明天的彩票值我已經順利的預測出來了:看看...四、七、5!嘿嘿...就是這個值了..有興趣的童鞋能夠去買了,中了算你的,不中也算你的...明天不中我還會贈送後天...大後天!。。。
其實通過上面的分析已經獲得對於排列三這種彩票他是有規律就是出現的機率集中於中間值,也就是4,若是從長期來看買這塊數據確定能賺。
而後咱們將這部分值保存到數據庫,而後拿着這部分勝利的數據,去到彩票網站買彩票去!
嘿嘿...接下來的事我就等着:升職、加薪、出任CEO、贏取白富美、走上人生巔峯.....哈哈...
我果斷的掏出了手機,進入到了彩票網站,選擇排列三這種彩票,準備購買:
4+7+5=16...哈哈,我利用「求和」這種方案就買16這個數字了!
可是我詳細看了看...
尼瑪!...選擇的數字獲得的回報率是不同的!也就是說越選擇接近4的中獎機率高,可是獲得的獎金回報率也少,選擇離4遠的數值中獎機率低,可是獲得的獎金回報率也高!...
我那個去...
個人高富帥夢、個人大溼夢!.....
結語
呵呵...經過上面的分析基本上咱們能看到時序算法的好處,從上面的結果預測值來看..其實和他們官網給出的獎金方案仍是有出入的,好比我預測求和值的大部分是1六、1四、17...這些值所有大於11...而根據它上面的圖片能夠看到他們推薦的最高中獎數應該是10和11...返回金額都是9塊錢!
有興趣的能夠繼續分析這塊..可能對於彩票這種機率事件的預測沒有規律可循,可是生活中大部分事件都有規律可循的,而這些是咱們所要挖掘和分析的。
文章的最後咱們給出前幾篇算法的文章鏈接:
若是您看了本篇博客,以爲對您有所收穫,尊重別人的勞動成果,請不要吝嗇您的「推薦」。