一、數據分析總的來講是:認清問題,解決問題正則表達式
二、實驗,(星巴克咖啡店),實驗控制組數據庫
三、最優化策略;橡皮鴨和橡皮魚優化
四、數據圖形化;重要的散點圖blog
五、假設檢驗,podphone手機明天或下個月會發布麼?最可能何時發佈。爲每一個猜測加權,比較。ci
六、貝葉斯統計:蜥蜴流感數據分析
七、主觀機率,石油投資,利用貝葉斯公式修正主管機率class
八、啓發法,快省樹決策樹。變量
九、直方圖,引入R語言軟件
十、迴歸語法
經過預想加薪和實際加薪,算出迴歸方程,預測加薪,散點圖大法再出。
只要能看出兩個變量之間具備密切的關係,只要迴歸線有意義,你就能夠充滿信心地讓軟件計算各個係數。
十一、偏差
機會偏差=實際結果與模型預測結果之間的誤差,又稱爲殘差。
用均方根偏差(殘差標準差)定量表示殘差分佈。
對於先後殘差標準差差距較大能夠將數據分爲兩段分析,分段不宜過多,不然無預測性。
R語言語句:
mylm <- lm(a~b,data) #迴歸表達式,~左邊是因變量,右邊是解釋變量。詳見R語言語法 summary(mylm)$coefficients #係數相關矩陣 summary(mylm)$sigma #殘差標準差
十二、數據庫
1三、整理數據,正則表達式