第一次做業 統計軟件簡介和技術操做

1、SPSShtml

(一)簡介python

       SPSS(Statistical Product and Service Solutions),「統計產品與服務解決方案」軟件。最初軟件全稱爲「社會科學統計表」(SolutionsStatistical Package for the Social Sciences),可是隨着SPSS產品服務領域的擴大和服務深度的增長,SPSS公司已於2000年正式將英文全稱更改成「統計產品與服務解決方案」,這標誌着SPSS的戰略方向正在作出重大調整。SPSS爲IBM公司推出的一系列用於統計學分析運算、數據挖掘、預測分析和決策支持任務的軟件產品及相關服務的總稱,有Windows和Mac OS X等版本。
      1984年SPSS總部首先推出了世界上第一個統計分析軟件微機版本SPSS/PC+,開創了SPSS微機系列產品的開發方向,極大地擴充了它的應用範圍,並使其能很快地應用於天然科學、技術科學、社會科學的各個領域。世界上許多有影響的報刊雜誌紛紛就SPSS的自動統計繪圖、數據的深刻分析、使用方便、功能齊全等方面給予了高度的評價。
(二)發展歷程
1968年:斯坦福大學三位學生建立了SPSS
1968年:誕生第一個用於大型機的統計軟件
1975年:在芝加哥成立SPSS總部
1984年:推出用於我的電腦的SPSS/PC+
1992年:推出Windows版本,同時全球自SPSS 11.0起,SPSS全稱爲「Statistical Product and Service Solutions」,即「統計產品和服務解決方案」
2009年:SPSS公司宣佈從新包裝旗下的SPSS產品線,定位爲預測統計分析軟件(Predictive Analytics Software)PASW,包括四部分:
PASW Statistics (formerly SPSS Statistics):統計分析
PASW Modeler (formerly Clementine) :數據挖掘
Data Collection family (formerly Dimensions):數據收集
PASW Collaboration and Deployment Services (formerly Predictive Enterprise Services):企業應用服務
2010年:隨着SPSS公司被IBM公司併購,各子產品家族名稱前面再也不以PASW爲名,修改成統一加上IBM SPSS字
(三)功能模塊
SPSS for Windows是一個組合式軟件包,它集數據錄入、整理、分析功能於一身。用戶能夠根據實際須要和計算機的功能選擇模塊,以下降對系統硬盤容量的要求,有利於該軟件的推廣應用。SPSS的基本功能包括數據管理、統計分析、圖表分析、輸出管理等等。SPSS統計分析過程包括描述性統計、均值比較、通常線性模型、相關分析、迴歸分析、對數線性模型、聚類分析、數據簡化、生存分析、時間序列分析、多重響應等幾大類,每類中又分好幾個統計過程,好比迴歸分析中又分線性迴歸分析、曲線估計、Logistic迴歸、Probit迴歸、加權估計、兩階段最小二乘法、非線性迴歸等多個統計過程,並且每一個過程當中又容許用戶選擇不一樣的方法及參數。SPSS也有專門的繪圖系統,能夠根據數據繪製各類圖形。
(四)產品特色
一、操做簡單
界面很是友好,除了數據錄入及部分命令程序等少數輸入工做須要鍵盤鍵入外,大多數操做可經過鼠標拖曳、點擊「菜單」、「按鈕」和「對話框」來完成。
二、編程方便
具備第四代語言的特色,告訴系統要作什麼,無需告訴怎樣作。只要瞭解統計分析的原理,無需通曉統計方法的各類算法,便可獲得須要的統計分析結果。對於常見的統計方法,SPSS的命令語句、子命令及選擇項的選擇絕大部分由「對話框」的操做完成。所以,用戶無需花大量時間記憶大量的命令、過程、選擇項。
三、功能方便
具備完整的數據輸入、編輯、統計分析、報表、圖形制做等功能。自帶11種類型136個函數。SPSS提供了從簡單的統計描述到複雜的多因素統計分析方法,好比數據的探索性分析、統計描述、列聯表分析、二維相關、秩相關、偏相關、方差分析、非參數檢驗、多元迴歸、生存分析、協方差分析、判別分析、因子分析、聚類分析、非線性迴歸、Logistic迴歸等。
四、數據接口
可以讀取及輸出多種格式的文件。好比由dBASE、FoxBASE、FoxPRO產生的*.dbf文件,文本編輯軟件生成的ASCⅡ數據文件,Excel的*.xls文件等都可轉換成可供分析的SPSS數據文件。可以把SPSS的圖形轉換爲7種圖形文件。結果可保存爲*.txt及html格式的文件。
五、模板組合
SPSS for Windows軟件分爲若干功能模塊。用戶能夠根據本身的分析須要和計算機的實際配置狀況靈活選擇。
六、針對性強
SPSS針對初學者、熟練者及精通者都比較適用。而且不少羣體只須要掌握簡單的操做分析,大多青睞於SPSS,像薛薇的《基於SPSS的數據分析》一書也較適用於初學者。而那些熟練或精通者也較喜歡SPSS,由於他們能夠經過編程來實現更強大的功能。
2、R數據
(一)簡介
R是用於統計分析、繪圖的語言和操做環境。R是屬於GNU系統的一個自由、免費、源代碼開放的軟件,它是一個用於統計計算和統計製圖的優秀工具。
(二)功能說明
R是一套完整的數據處理、計算和製圖軟件系統。其功能包括:數據存儲和處理系統;數組運算工具(其向量、矩陣運算方面功能尤爲強大);完整連貫的統計分析工具;優秀的統計製圖功能;簡便而強大的編程語言:可操縱數據的輸入和輸出,可實現分支、循環,用戶可自定義功能。R的功能可以經過由用戶撰寫的套件加強。增長的功能有特殊的統計技術、繪圖功能,以及編程界面和數據輸出/輸入功能。這些軟件包是由R語言、LaTeX、Java及最經常使用C語言和Fortran撰寫。下載的執行檔版本會連同一批覈心功能的軟件包,而根據CRAN紀錄有過千種不一樣的軟件包。其中有幾款較爲經常使用,例如用於經濟計量、財經分析、人文科學研究以及人工智能。
(三)發展歷程
R是統計領域普遍使用的誕生於1980年左右的S語言的一個分支。能夠認爲R是S語言的一種實現。而S語言是由AT&T貝爾實驗室開發的一種用來進行數據探索、統計分析和做圖的解釋型語言。最初S語言的實現版本主要是S-PLUS。S-PLUS是一個商業軟件,它基於S語言,並由MathSoft公司的統計科學部進一步完善。後來新西蘭奧克蘭大學的Robert Gentleman和Ross Ihaka及其餘志願人員開發了一個R系統。由「R開發核心團隊」負責開發。R能夠看做貝爾實驗室(AT&T BellLaboratories)的RickBecker,JohnChambers和AllanWilks開發的S語言的一種實現。固然,S語言也是S-Plus的基礎。因此,二者在程序語法上能夠說是幾乎同樣的,可能只是在函數方面有細微差異,程序十分容易地就能移植到一程序中,而不少一的程序只要稍加修改也能運用於R。
(四)特色
1.R是自由軟件。這意味着它是徹底免費,開放源代碼的。能夠在它的網站及其鏡像中下載任何有關的安裝程序、源代碼、程序包及其源代碼、文檔資料。標準的安裝文件身自身就帶有許多模塊和內嵌統計函數,安裝好後能夠直接實現許多經常使用的統計功能。[2]  
2.R是一種可編程的語言。做爲一個開放的統計編程環境,語法通俗易懂,很容易學會和掌握語言的語法。並且學會以後,咱們能夠編制本身的函數來擴展示有的語言。這也就是爲何它的更新速度比通常統計軟件,如,SPSS,SAS等快得多。大多數最新的統計方法和技術均可以在R中直接得的.
3. 全部R的函數和數據集是保存在程序包裏面的。只有當一個包被載入時,它的內容才能夠被訪問。一些經常使用、基本的程序包已經被收入了標準安裝文件中,隨着新的統計分析方法的出現,標準安裝文件中所包含的程序包也隨着版本的更新而不斷變化。在另外版安裝文件中,已經包含的程序包有:base一R的基礎模塊、mle一極大似然估計模塊、ts一時間序列分析模塊、mva一多元統計分析模塊、survival一輩子存分析模塊等等.
4.R具備很強的互動性。除了圖形輸出是在另外的窗口處,它的輸入輸出窗口都是在同一個窗口進行的,輸入語法中若是出現錯誤會立刻在窗口口中獲得提示,對之前輸入過的命令有記憶功能,能夠隨時再現、編輯修改以知足用戶的須要。輸出的圖形能夠直接保存爲JPG,BMP,PNG等圖片格式,還能夠直接保存爲PDF文件。另外,和其餘編程語言和數據庫之間有很好的接口。
5.若是加入R的幫助郵件列表一,天天均可能會收到幾十份關於R的郵件資訊。能夠和全球一流的統計計算方面的專家討論各類問題,能夠說是全世界最大、最前沿的統計學家思惟的彙集地.

3、STATS程序員

(一)簡介算法

tatsmodels是Python的統計建模和計量經濟學工具包,包括一些描述統計、統計模型估計和推斷。這篇文章是Statsmodels系列文章的第一篇,主要介紹一下Statsmodels能幹什麼,以方便一些初學者選擇是否須要學習該模塊。shell

4、PYTHON數據庫

(一)簡介編程

Python (英國發音:/ˈpaɪθən/ 美國發音:/ˈpaɪθɑːn/), 是一種面向對象的解釋型計算機程序設計語言,由荷蘭人Guido van Rossum於1989年發明,第一個公開發行版發行於1991年。Python是純粹的自由軟件, 源代碼和解釋器CPython遵循 GPL(GLN General Public License)協議  。Python語法簡潔清晰,特點之一是強制用空白符(white space)做爲語句縮進。
Python具備豐富和強大的庫。它常被暱稱爲J膠水語言,可以把用其餘語言製做的各類模塊(尤爲是C/CC++)很輕鬆地聯結在一塊兒。常見的一種應用情形是,使用Python快速生成程序的原型(有時甚至是程序的最終界面),而後對其中[3]   有特別要求的部分,用更合適的語言改寫,好比3D遊戲中的圖形渲染模塊,性能要求特別高,就能夠用C/C++重寫,然後封裝爲Python能夠調用的擴展類庫。須要注意的是在您使用擴展類庫時可能須要考慮平臺問題,某些可能不提供跨平臺的實現。7月20日,IEEE發佈2017年編程語言排行榜:Python高居首位。
(二)發展歷史
自從20世紀90年代初Python語言誕生至今,它已被逐漸普遍應用於系統管理任務的處理和Web編程。
Python的創始人爲Guido van Rossum。1989年聖誕節期間,在阿姆斯特丹,Guido爲了打發聖誕節的無趣,決心開發一個新的腳本解釋程序,作爲ABC 語言的一種繼承。之因此選中Python(大蟒蛇的意思)做爲該編程語言的名字,是由於他是一個叫Monty Python的喜劇團體的愛好者。
ABC是由Guido參加設計的一種教學語言。就Guido本人看來,ABC 這種語言很是優美和強大,是專門爲非專業程序員設計的。可是ABC語言並無成功,究其緣由,Guido 認爲是其非開 標識就這樣,Python在Guido手中誕生了。能夠說,Python是從ABC發展起來,主要受到了Modula-3(另外一種至關優美且強大的語言,爲小型團體所設計的)的影響。而且結合了Unix shell和C的習慣。
Python 已經成爲最受歡迎的程序設計語言之一。2011年1月,它被TIOBE編程語言排行榜評爲2010年度語言。自從2004年之後,python的使用率呈線性增加
(三)設計風格
Python在設計上堅持了清晰劃一的風格,這使得Python成爲一門易讀、易維護,而且被大量用戶所歡迎的、用途普遍的語言。
設計者開發時總的指導思想是,對於一個特定的問題,只要有一種最好的方法來解決就行了。這在由Tim Peters寫的Python格言(稱爲The Zen of Python)裏面表述爲:There should be one-- and preferably only one --obvious way to do it. 這正好和Perl語言(另外一種功能相似的高級動態語言)的中心思想TMTOWTDI(There's More Than One Way To Do It)徹底相反。
Python的做者有意的設計限制性很強的語法,使得很差的編程習慣(例如if語言的下一行不向右縮進)都不能經過編譯。其中很重要的一項就是Python的縮進規則。
一個和其餘大多數語言(如C)的區別就是,一個模塊的界限,徹底是由每行的首字符在這一行的位置來決定的(而C語言是用一對花括號{}來明確的定出模塊的邊界的,與字符的位置毫無關係)。這一點曾經引發過爭議。由於自從C這類的語言誕生後,語言的語法含義與字符的排列方式分離開來,曾經被認爲是一種程序語言的進步。不過不能否認的是,經過強制程序員們縮進(包括if,for和函數定義等全部須要使用模塊的地方),Python確實使得程序更加清晰和美觀.
相關文章
相關標籤/搜索