用R作數據分析(1)——R簡介

        R語言是由 Ross IhakaRobert Gentleman二位建立的,這也許能夠解釋爲何叫R語言。如今由「R開發核心團隊」負責開發。R是基於S語言的一個GNU項目。php

  1. 1、R語言介紹html

       R是爲統計計算和做圖的一門語言和環境。是一個GNU項目,和S語言和環境很類似,S語言是由BELL實驗室的John Chambers和他的同事開發的。R語言能夠認爲是從S語言衍生而來的,他們以前有很重要的不一樣,可是大多數用S語言寫的代碼也能夠在R中運行。算法

       目前R在高校很是流行,特別是隨着這幾年互聯網的發展,(R在一些大公司的運用獲得的實踐,例如:國外的google、linkdin、facebook等,國內一些大型互聯網公司也在開始使用R),及隨着互聯網版權的意識加強,也促使了R在互聯網的發展。固然R在不少領域都有很普遍的運用。編程

       R語言是開源的,同時能夠運行在各類平臺上(Linux、Windows、MacOS等)。R的許多軟件包是由R語言、 LaTeX、Java及最經常使用C語言和Fortran撰寫。編程語言

      能夠說如今R包含各類各樣的功能,能夠說目前你能想到的功能,均可以找到一個或者多個R包來實現。幾千個R包,哪一個才最適合你呢?「最適合你本身的R包,也許就是你本身寫的那個包」。函數

2、 R軟件安裝下載工具

      CRAN地址:http://www.r-project.org/,什麼是CRAN:學習

      CRAN爲Comprehensive R Archive Network(R綜合典藏網)的簡稱。它除了收藏了R的執行檔下載版、源代碼和說明文件,也收錄了各類用戶撰寫的軟件包。現時,全球有超過一百個CRAN鏡像站。(來源http://baike.baidu.com/view/942569.htm)大數據

      根據你的操做系統,下載相應的R語言安裝文件。google

       下載地址:http://ftp.ctex.org/mirrors/CRAN/

R安裝 

3、 R語言的特色     一、變量不須要申明便可引用。     二、R語言的核心是:向量。     三、R語言是一個函數語言。     四、向量中的下標是從1開始引用的。     五、R是腳本語言、面像對象;

4、 如何學學習R語言      《R語言學習由淺入深路線圖》 這篇文章你們能夠參考,這篇文章簡單介紹了一下R學習的資料,你們能夠根據須要進行參考。那麼如何才能學好R,我的理解有如下幾點:

一、不要指望你能學會R中全部的包。不要把目標定的那麼高。

二、關鍵能理解R語言的內涵。多看看CRAN上的相關文檔,例如:季刊、R語言相關新聞,特別是每次版本更新的一些內容。三、運用     若是你是作數據分析相關的工做的,必定要把學習到的R語言知識運用到你的工做中,無論你把R語言當用一門編程語言仍是統計工具,用的多了,天然你就有感受,不少東西你就記住了。

四、持續     天天花點時間寫幾條R代碼,實現一些小功能。若是你工做上就用R,那是最完美的。

五、多看     多看別人寫的代碼,R運用的案例。你能夠google一下R會有不少好的博客,文章。不少人都是R的GREEK。

六、開放      必定要開放、分享的心態。多與別人交流,不要老是需求,必定要學習給予。(我是我我的觀點,若是要真好用到R,讓R發揮價值就是必須的。)

七、總結     學到的東西,及時作好總結,能夠總結成案例或者筆記,若是能夠歡迎分享給你們(http://www.itongji.cn/member/article_add.php 到這投稿是一個不錯的選擇)     

5、 我對R語言的理解和見解       隨時互聯網的發展,特別是互聯網對於版權、成本的因素考慮,由於免費、開源使愈來愈多的公司開始用R語言來處理數據、分析數據、完成模型等,固然這其中也伴隨着對於數據價值挖掘的,特別是在大數據的背景下,想經過對數據挖掘&分析創建本身的競爭優點。       R不只 免費還有各類各樣的的功能包資源。從某種程度上講,任何你想要的功能應該均可以找到對應的包,只是說是否徹底知足,對於一些算法研究人員來講,能夠在原來的代碼的基礎進行借鑑。這也許就是爲何R最開始主要用到高校或者學術領域(固然和國外學者、專家這種自由、開放的環境或者意識有很關係,這也許就是爲何許多開源軟件都是國外出來,不多看到國內的大公司有什麼好的東西開源)。       不少行業人士都說R是將來的「王道」,就像unix的發展過程同樣。我以爲將來必定有屬於R的一片天空,並且這種天空能夠說是接近無限。因此,對於有志於從事數據挖掘、數據分析這個行業的朋友來講,掌握R是也許會成爲將來的必備技能(就像如今數據分析師大多要求會:SQL)。      最後,我對R語言的理解與總結能夠歸納爲一句話:「開源、二次加工、分享精神」。

相關文章
相關標籤/搜索