《深刻淺出數據分析》

一、數據分析總的來講是:認清問題,解決問題正則表達式

       

二、實驗,(星巴克咖啡店),實驗控制組數據庫

三、最優化策略;橡皮鴨和橡皮魚優化

四、數據圖形化;重要的散點圖blog

五、假設檢驗,podphone手機明天或下個月會發布麼?最可能何時發佈。爲每一個猜測加權,比較。ci

六、貝葉斯統計:蜥蜴流感數據分析

七、主觀機率,石油投資,利用貝葉斯公式修正主管機率class

八、啓發法,快省樹決策樹。變量

九、直方圖,引入R語言軟件

十、迴歸語法

  • 經過預想加薪和實際加薪,算出迴歸方程,預測加薪,散點圖大法再出。

  • 只要能看出兩個變量之間具備密切的關係,只要迴歸線有意義,你就能夠充滿信心地讓軟件計算各個係數。

十一、偏差

  • 機會偏差=實際結果與模型預測結果之間的誤差,又稱爲殘差。

  • 用均方根偏差(殘差標準差)定量表示殘差分佈。

  • 對於先後殘差標準差差距較大能夠將數據分爲兩段分析,分段不宜過多,不然無預測性。

  • R語言語句:

    mylm <- lm(a~b,data) #迴歸表達式,~左邊是因變量,右邊是解釋變量。詳見R語言語法
    summary(mylm)$coefficients #係數相關矩陣
    summary(mylm)$sigma #殘差標準差

十二、數據庫

1三、整理數據,正則表達式

相關文章
相關標籤/搜索