《時間序列分析及應用-R語言》,由美 Jonathan D. Cryer和Kung-Sik Chan編著,潘鴻宇等譯,機械工業出版社出版,我這本是第二版。這是一本2008年就寫好的書,2011年中文出版。算起來都7年了,不由感概一下,中國在這方面確實落後一大截子了。大數據
數據分析無非是分析樣本數據,不管多少數據都只是一個樣本而已。這個樣本數據從時空分析的角度來看,主要有時間序列和空間序列,大部分數據同時會有時空屬性,但目前對時空同時分析的比較少。統計學主要分析時間序列,而地理信息系統(GIS)更多地處理和分析空間序列即空間分佈,兩者結合起來就叫空間過程,分析和表達的難度都比較大。數據分析
時間序列分析最經常使用的是極值、平滑和迴歸等操做,從而發現一些長期性的趨勢。對週期性過程須要採用模型識別方法,而後對參數和偏差進行計算,以評估模型的精度。模型建好了就能夠將新的樣本數據代入進去,從而預測將來的可能值。下載
時間序列分析的基本處理使用R可以很容易完成,難的是對複雜過程的建模。常見的有季節變化、正餘弦等模型,更復雜的譜分析模型。因爲現實世界的複雜性,這些模型每每會疊加到一塊兒,造成多個波,這個因爲難度太大,這本書裏沒有涉及。
方法
這本書經過對氣溫等數據做爲例子,對使用R語言進行分析的方法進行了實戰指導,並且附上了各類統計參數的計算公式,很是實用,可是對於公式恐懼症患者有點讓人看起來頭疼。統計
不過,要作數據分析,這些基本功仍是必需要掌握的,不然只能去當個小說家,去寫寫哪些「啤酒+尿布」的「大數據分析」的故事了。
數據
對於有心去作大數據分析的人,把這本書啃下來,隨便下載點數據作一些圖表,拿出來一秀,基本上就能雷倒一大片人了。仍是比較值得的。
圖表