管理統計學第一次做業

1、軟件簡介html

1 .SPSSlinux

SPSS簡介:SPSS全稱Statistical Product and Service Solutions,是一款"統計產品與服務解決方案"軟件。最初軟件全稱爲"社會科學統計軟件包"(SolutionsStatistical Package for the Social Sciences),可是隨着SPSS產品服務領域的擴大和服務深度的增長,SPSS公司已於2000年正式將英文全稱更改成"統計產品與服務解決方案",標誌着SPSS的戰略方向正在作出重大調整。爲IBM公司推出的一系列用於統計學分析運算、數據挖掘、預測分析和決策支持任務的軟件產品及相關服務的總稱SPSS,有Windows和Mac OS X等版本。android

SPSS發展歷史:

1968年:斯坦福大學三位學生建立了SPSS正則表達式

1968年:誕生第一個用於大型機的統計軟件算法

1975年:在芝加哥成立SPSS總部數據庫

1984年:推出用於我的電腦的SPSS/PC+編程

1992年:推出Windows版本,同時全球自SPSS 11.0起,SPSS全稱爲"Statistical Product and Service Solutions",即"統計產品和服務解決方案"數組

2009年:SPSS公司宣佈從新包裝旗下的SPSS產品線,定位爲預測統計分析軟件(Predictive Analytics Software)PASW,包括四部分:瀏覽器

PASW Statistics (formerly SPSS Statistics):統計分析網絡

PASW Modeler (formerly Clementine) :數據挖掘

Data Collection family (formerly Dimensions):數據收集

PASW Collaboration and Deployment Services (formerly Predictive Enterprise Services):企業應用服務

2010年:隨着SPSS公司被IBM公司併購,各子產品家族名稱前面再也不以PASW爲名,修改成統一加上IBM SPSS字樣

SPSS頁面一覽:

 

2.R語言

R語言簡介:R是用於統計分析、繪圖的語言和操做環境。R是屬於GNU系統的一個自由、免費、源代碼開放的軟件,它是一個用於統計計算和統計製圖的優秀工具。

R語言發展歷史:R是統計領域普遍使用的誕生於1980年左右的S語言的一個分支。能夠認爲R是S語言的一種實現。而S語言是由AT&T貝爾實驗室開發的一種用來進行數據探索、統計分析和做圖的解釋型語言。最初S語言的實現版本主要是S-PLUS。S-PLUS是一個商業軟件,它基於S語言,並由MathSoft公司的統計科學部進一步完善。後來Auckland大學的Robert Gentleman和Ross Ihaka及其餘志願人員開發了一個R系統。由"R開發核心團隊"負責開發。 R是基於S語言的一個GNU項目,因此也能夠看成S語言的一種實現,一般用S語言編寫的代碼均可以不做修改的在R環境下運行。 R的語法是來自Scheme。R的使用與S-PLUS有不少相似之處,這兩種語言有必定的兼容性。S-PLUS的使用手冊,只要稍加修改就可做爲R的使用手冊。因此有人說:R,是S-PLUS的一個"克隆"。

R語言功能:

R是一套完整的數據處理、計算和製圖軟件系統。其功能包括:數據存儲和處理系統;數組運算工具(其向量、矩陣運算方面功能尤爲強大);完整連貫的統計分析工具;優秀的統計製圖功能;簡便而強大的編程語言:可操縱數據的輸入和輸出,可實現分支、循環,用戶可自定義功能。貝爾實驗室貝爾實驗室

與其說R是一種統計軟件,還不如說R是一種數學計算的環境,由於R並非僅僅提供若干統計程序、使用者只需指定數據庫和若干參數即可進行一個統計分析。R的思想是:它能夠提供一些集成的統計工具,但更大量的是它提供各類數學計算、統計計算的函數,從而使使用者能靈活機動的進行數據分析,甚至創造出符合須要的新的統計計算方法。

該語言的語法表面上相似 C,但在語義上是函數設計語言(functional programming language)的變種而且和Lisp以及APL有很強的兼容性。特別的是,它容許在"語言上計算"(computing on the language)。這使得它能夠把表達式做爲函數的輸入參數,而這種作法對統計模擬和繪圖很是有用。

R是一個免費的自由軟件,它有UNIX、LINUX、MacOS和WINDOWS版本,都是能夠免費下載和使用的。在那兒能夠下載到R的安裝程序、各類外掛程序和文檔。在R的安裝程序中只包含了8個基礎模塊,其餘外在模塊能夠經過CRAN得到。

R的原代碼可自由下載使用,亦有已編譯的執行檔版本能夠下載,可在多種平臺下運行,包括UNIX(也包括FreeBSD和Linux)、Windows和MacOS。 R主要是以命令行操做,同時有人開發了幾種圖形用戶界面。

R內含多種統計學及數字分析功能。由於S的血緣,R比其餘統計學或數學專用的編程語言有更強的物件導向(面向對象程序設計)功能。

R的另外一強項是繪圖功能,製圖具備印刷的素質,也可加入數學符號。

雖然R主要用於統計分析或者開發統計相關的軟體,但也有人用做矩陣計算。其分析速度可媲美GNU Octave甚至商業軟件MATLAB。

R的功能可以經過由用戶撰寫的套件加強。增長的功能有特殊的統計技術、繪圖功能,以及編程界面和數據輸出/輸入功能。這些軟件包是由R語言、LaTeX、Java及最經常使用C語言和Fortran撰寫。下載的執行檔版本會連同一批覈心功能的軟件包,而根據CRAN紀錄有過千種不一樣的軟件包。其中有幾款較爲經常使用,例如用於經濟計量、財經分析、人文科學研究以及人工智能。

3.STATA

STATA簡介:新版本的STATA採用最具親和力的窗口接口,使用者自行創建程序時,軟件能提供具備直接命令式的語法。Stata提供完整的使用手冊,包含統計樣本創建、解釋、模型與語法、文獻等超過一萬餘頁的出版品。

除此以外,Stata軟件能夠透過網絡實時更新天天的最新功能,更能夠得知世界各地的使用者對於STATA公司提出的問題與解決之道。使用者也能夠透過Stat軟件logo軟件logoa Journal得到許許多多的相關訊息以及書籍介紹等。另一個獲取龐大資源的管道就是Statalist,它是一個獨立的listserver,每個月交替提供使用者超過1000個訊息以及50個程序。

STATAS功能:1.STATA統計功能很強,除了傳統的統計分析方法外,還收集了近20年發展起來的新方法,如Cox比例風險迴歸,指數與Weibull迴歸,多類結果與有序結果的logistic迴歸,Poisson迴歸,負二項迴歸及廣義負二項迴歸,隨機效應模型等。具體說, Stata具備以下統計分析能力:

數值變量資料的通常分析:參數估計,t檢驗,單因素和多因素的方差分析,協方差分析,交互效應模型,平衡和非平衡設計,嵌套設計,隨機效應,多個均數的兩兩比較,缺項數據的處理,方差齊性檢驗,正態性檢驗,變量變換等。

分類資料的通常分析:參數估計,列聯表分析 ( 列聯繫數,確切機率 ) ,流行病學表格分析等。

等級資料的通常分析:秩變換,秩和檢驗,秩相關等

相關與迴歸分析:簡單相關,偏相關,典型相關,以及多達數十種的迴歸分析方法,如多元線性迴歸,逐步迴歸,加權迴歸,穩鍵迴歸,二階段迴歸,百分位數 ( 中位數 ) 迴歸,殘差分析、強影響點分析,曲線擬合,隨機效應的線性迴歸模型等。

其餘方法:質量控制,整羣抽樣的設計效率,診斷試驗評價, kappa等。

                    2.Stata的做圖功能,主要提供以下八種基本圖形的製做 : 直方圖(histogram),條形圖(bar),百分條圖 (oneway),百分圓圖(pie),散點圖(two way),散點圖矩陣(matrix),星形圖(star),分位數圖。這些圖形的巧妙應用,能夠知足絕大多數用戶的統計做圖要求。在有些非繪圖命令中,也提供了專門繪製某種圖形的功能,如在生存分析中,提供了繪製生存曲線圖,迴歸分析中提供了殘差圖等。

                    3.Stata的矩陣運算功能。矩陣代數是多元統計分析的重要工具, Stata提供了多元統計分析中所需的矩陣基本運算,如矩陣的加、積、逆、 Cholesky分解、 Kronecker內積等;還提供了一些高級運算,如特徵根、特徵向量、奇異值分解等;在執行完某些統計分析命令後,還提供了一些系統矩陣,如估計係數向量、估計係數的協方差矩陣等。

4.PYTHON

Python簡介:是一種面向對象、解釋型計算機程序設計語言,由Guido van Rossum於1989年末發明,第一個公開發行版發行於1991年,Python 源代碼一樣遵循 GPL(GNU General Public License)協議。Python語法簡潔而清晰,具備豐富和強大的類庫。它常被暱稱爲膠水語言,可以把用其餘語言製做的各類模塊(尤爲是C/C++)很輕鬆地聯結在一塊兒。常見的一種應用情形是,使用Python快速生成程序的原型(有時甚至是程序的最終界面),而後對其中有特別要求的部分,用更合適的語言改寫,好比3D遊戲中的圖形渲染模塊,性能要求特別高,就能夠用C/C++重寫,然後封裝爲Python能夠調用的擴展類庫。須要注意的是在您使用擴展類庫時可能須要考慮平臺問題,某些可能不提供跨平臺的實現。

Phtyon特色:1簡單:Python是一種表明簡單主義思想的語言。閱讀一個良好的Python程序就感受像是在讀英語同樣。它使你可以專一於解決問題而不是去搞明白語言自己。

易學:Python極其容易上手,由於Python有極其簡單的語法。

                       2免費、開源:Python是FLOSS(自由/開放源碼軟件)之一。使用者能夠自由地發佈這個軟件的拷貝、閱讀它的源代碼、對它作改動、把它的一部分用於新的自由軟件中。FLOSS是基於一個團體分享知識的概念。

                       3高層語言:用Python語言編寫程序的時候無需考慮諸如如何管理你的程序使用的內存一類的底層細節。

                       4可移植性:因爲它的開源本質,Python已經被移植在許多平臺上(通過改動使它可以工做在不一樣平臺上)。這些平臺包括Linux、Windows、FreeBSD、Macintosh、Solaris、OS/二、Amiga、AROS、AS/400、BeOS、OS/390、z/OS、Palm OS、QNX、VMS、Psion、Acom RISC OS、VxWorks、PlayStation、Sharp Zaurus、Windows CE、PocketPC、Symbian以及Google基於linux開發的android平臺。

                       5解釋性:一個用編譯性語言好比C或C++寫的程序能夠從源文件(即C或C++語言)轉換到一個你的計算機使用的語言(二進制代碼,即0和1)。這個過程經過編譯器和不一樣的標記、選項完成。

運行程序的時候,鏈接/轉載器軟件把你的程序從硬盤複製到內存中而且運行。而Python語言寫的程序不須要編譯成二進制代碼。你能夠直接從源代碼運行 程序。

在計算機內部,Python解釋器把源代碼轉換成稱爲字節碼的中間形式,而後再把它翻譯成計算機使用的機器語言並運行。這使得使用Python更加簡單。也使得Python程序更加易於移植。

                    6面向對象:Python既支持面向過程的編程也支持面向對象的編程。在「面向過程」的語言中,程序是由過程或僅僅是可重用代碼的函數構建起來的。在「面向對象」的語言中,程序是由數據和功能組合而成的對象構建起來的。

                    7可擴展性:若是須要一段關鍵代碼運行得更快或者但願某些算法不公開,能夠部分程序用C或C++編寫,而後在Python程序中使用它們。

                     8可嵌入性:能夠把Python嵌入C/C++程序,從而向程序用戶提供腳本功能。

                    9豐富的庫:Python標準庫確實很龐大。它能夠幫助處理各類工做,包括正則表達式、文檔生成、單元測試線程、數據庫、網頁瀏覽器、CGI、FTP、電子郵件、XML、XML-RPC、HTML、WAV文件、密碼系統、GUI(圖形用戶界面)、Tk和其餘與系統有關的操做。這被稱做Python的「功能齊全」理念。除了標準庫之外,還有許多其餘高質量的庫,如wxPython、Twisted和Python圖像庫等等。

                      10規範的代碼:Python採用強制縮進的方式使得代碼具備較好可讀性。而Python語言寫的程序不須要編譯成二進制代碼。

 

2、操做演示

1打開文件

2排序

3新增變量

4合併文件

5使用函數

相關文章
相關標籤/搜索