做業一 統計軟件簡介與數據操做

SPSS(Statistical Product and Service Solutions),"統計產品與服務解決方案"軟件。最初軟件全稱爲"社會科學統計軟件包"(SolutionsStatistical Package for the Social Sciences),可是隨着SPSS產品服務領域的擴大和服務深度的增長,SPSS公司已於2000年正式將英文全稱更改成"統計產品與服務解決方案",標誌着SPSS的戰略方向正在作出重大調整。爲IBM公司推出的一系列用於統計學分析運算、數據挖掘、預測分析和決策支持任務的軟件產品及相關服務的總稱SPSS,有Windows和Mac OS X等版本。html

軟件功能:SPSS是世界上最先採用圖形菜單驅動界面的統計軟件,它最突出的特色就是操做界面極爲友好,輸出結果美觀漂亮。它將幾乎全部的功能都以統1、規範的界面展示出來,使用Windows的窗口方式展現各類管理和分析數據方法的功能,對話框展現出各類功能選擇項。用戶只要掌握必定的Windows操做技能,精通統計分析原理,就可使用該軟件爲特定的科研工做服務。SPSS採用相似EXCEL表格的方式輸入與管理數據,數據接口較爲通用,能方便的從其餘數據庫中讀入數據。其統計過程包括了經常使用的、較爲成熟的統計過程,徹底能夠知足非統計專業人士的工做須要。輸出結果十分美觀,存儲時則是專用的SPO格式,能夠轉存爲HTML格式和文本格式。對於熟悉老版本編程運行方式的用戶,SPSS還特別設計了語法生成窗口,用戶只需在菜單中選好各個選項,而後按"粘貼"按鈕就能夠自動生成標準的SPSS程序。極大的方便了中、高 級用戶。python

SPSS for Windows是一個組合式軟件包,它集數據錄入、整理、分析功能於一身。用戶能夠根據實際須要和計算機的功能選擇模塊,以下降對系統硬盤容量的要求,有利於該軟件的推廣應用。SPSS的基本功能包括數據管理、統計分析、圖表分析、輸出管理等等。SPSS統計分析過程包括描述性統計、均值比較、通常線性模型、相關分析、迴歸分析、對數線性模型、聚類分析、數據簡化、生存分析時間序列分析、多重響應等幾大類,每類中又分好幾個統計過程,好比迴歸分析中又分線性迴歸分析、曲線估計、Logistic迴歸、Probit迴歸、加權估計、兩階段最小二乘法、非線性迴歸等多個統計過程,並且每一個過程當中又容許用戶選擇不一樣的方法及參數。SPSS也有專門的繪圖系統,能夠根據數據繪製各類圖形。git

打開界面:先看變量視圖,再看數據視圖程序員

 

計算變量:統計量github

A與B的和:正則表達式

A與B的均值:sql

 

排序:數據庫

 

 

 

R語言編程

R是用於統計分析繪圖的語言和操做環境。R是屬於GNU系統的一個自由、免費、源代碼開放的軟件,它是一個用於統計計算和統計製圖的優秀工具網絡

R做爲一種統計分析軟件,是集統計分析與圖形顯示於一體的。它能夠運行於UNIX,Windows和Macintosh的操做系統上,並且嵌入了一個很是方便實用的幫助系統,相比於其餘統計分析軟件,R還有如下特色:
1.R是自由軟件。這意味着它是徹底免費,開放源代碼的。能夠在它的網站及其鏡像中下載任何有關的安裝程序、源代碼、程序包及其源代碼、文檔資料。標準的安裝文件身自身就帶有許多模塊和內嵌統計函數,安裝好後能夠直接實現許多經常使用的統計功能。[2]  
2.R是一種可編程的語言。做爲一個開放的統計編程環境,語法通俗易懂,很容易學會和掌握語言的語法。並且學會以後,咱們能夠編制本身的函數來擴展示有的語言。這也就是爲何它的更新速度比通常統計軟件,如,SPSS,SAS等快得多。大多數最新的統計方法和技術均可以在R中直接獲得。[2]  
3. 全部R的函數和數據集是保存在程序包裏面的。只有當一個包被載入時,它的內容才能夠被訪問。一些經常使用、基本的程序包已經被收入了標準安裝文件中,隨着新的統計分析方法的出現,標準安裝文件中所包含的程序包也隨着版本的更新而不斷變化。在另外版安裝文件中,已經包含的程序包有:base一R的基礎模塊、mle一極大似然估計模塊、ts一時間序列分析模塊、mva一多元統計分析模塊、survival一輩子存分析模塊等等.[2]  
4.R具備很強的互動性。除了圖形輸出是在另外的窗口處,它的輸入輸出窗口都是在同一個窗口進行的,輸入語法中若是出現錯誤會立刻在窗口口中獲得提示,對之前輸入過的命令有記憶功能,能夠隨時再現、編輯修改以知足用戶的須要。輸出的圖形能夠直接保存爲JPG,BMP,PNG等圖片格式,還能夠直接保存爲PDF文件。另外,和其餘編程語言和數據庫之間有很好的接口。[2]  
5.若是加入R的幫助郵件列表一,天天均可能會收到幾十份關於R的郵件資訊。能夠和全球一流的統計計算方面的專家討論各類問題,能夠說是全世界最大、最前沿的統計學家思惟的彙集地.[2]  
R是基於S語言的一個GNU項目,因此也能夠看成S語言的一種實現,一般用S語言編寫的代碼均可以不做修改的在R環境下運行。 R的語法是來自Scheme。R的使用與S-PLUS有不少相似之處,這兩種語言有必定的兼容性。S-PLUS的使用手冊,只要稍加修改就可做爲R的使用手冊。因此有人說:R,是S-PLUS的一個「克隆」。
可是請不要忘了:R是免費的(R is free)。R語言源代碼託管在github,具體地址能夠看參考資料。[3]   。
R語言的下載能夠經過CRAN的鏡像來查找。
R語言有域名爲.cn的下載地址,有六個,其中兩個由Datagurn,由 中國科學技術大學提供的。R語言Windows版,其中由兩個下載地點是Datagurn和 USTC提供的。

 


stata軟件介紹

Stata的統計功能很強,除了傳統的統計分析方法外,還收集了近20年發展起來的新方法,如Cox比例風險迴歸,指數與Weibull迴歸,多類結果與有序結果的logistic迴歸,Poisson迴歸,負二項迴歸及廣義負二項迴歸,隨機效應模型等。具體說, Stata具備以下統計分析能力:

數值變量資料的通常分析:參數估計,t檢驗,單因素和多因素的方差分析,協方差分析,交互效應模型,平衡和非平衡設計,嵌套設計,隨機效應,多個均數的兩兩比較,缺項數據的處理,方差齊性檢驗,正態性檢驗,變量變換等。

分類資料的通常分析:參數估計,列聯表分析 ( 列聯繫數,確切機率 ) ,流行病學表格分析等。

等級資料的通常分析:秩變換,秩和檢驗,秩相關等

 

Python(英語發音:/ˈpaɪθən/), 是一種面向對象、解釋型計算機程序設計語言,由Guido van Rossum於1989年末發明,第一個公開發行版發行於1991年,Python 源代碼一樣遵循 GPL(GNU General Public License)協議。Python語法簡潔而清晰,具備豐富和強大的類庫。它常被暱稱爲膠水語言,可以把用其餘語言製做的各類模塊(尤爲是C/C++)很輕鬆地聯結在一塊兒。常見的一種應用情形是,使用Python快速生成程序的原型(有時甚至是程序的最終界面),而後對其中有特別要求的部分,用更合適的語言改寫,好比3D遊戲中的圖形渲染模塊,性能要求特別高,就能夠用C/C++重寫,然後封裝爲Python能夠調用的擴展類庫。須要注意的是在您使用擴展類庫時可能須要考慮平臺問題,某些可能不提供跨平臺的實現。

應用:

系統編程:提供API(Application Programming Interface應用程序編程接口),能方便進行系統維護和管理,Linux下標誌性語言之一,是不少系統管理員理想的編程工具。

圖形處理:有PIL、Tkinter等圖形庫支持,能方便進行圖形處理。

數學處理:NumPy擴展提供大量與許多標準數學庫的接口。

文本處理:python提供的re模塊能支持正則表達式,還提供SGML,XML分析模塊,許多程序員利用python進行XML程序的開發。

數據庫編程:程序員可經過遵循Python DB-API(數據庫應用程序編程接口)規範的模塊與Microsoft SQL Server,Oracle,Sybase,DB2,Mysql、SQLite等數據庫通訊。python自帶有一個Gadfly模塊,提供了一個完整的SQL環境。

網絡編程:提供豐富的模塊支持sockets編程,能方便快速地開發分佈式應用程序。不少大規模軟件開發計劃例如Zope,Mnet 及BitTorrent. Google都在普遍地使用它。

Web編程:應用的開發語言,支持最新的XML技術。

多媒體應用:Python的PyOpenGL模塊封裝了「OpenGL應用程序編程接口」,能進行二維和三維圖像處理。PyGame模塊可用於編寫遊戲軟件

 

相關文章
相關標籤/搜索