R語言筆記:用R語言讀取EXCEL文件的方法

        在工做中,咱們獲得的數據源通常是以Excel文件爲多,偶有CSV文件或TXT文件等。資深表哥/表姐們都知道,Excel自帶數據統計功能,但卻處理不了大數據集。而CSV與TXT格式的文件,雖然容量大,但因爲是純文本文件,因此不具備數據處理的功能。函數

        爲了解決這一尷尬的問題,下面我就教一下你們怎麼用統計專業的R語言來讀取數據(數據處理以前很重要的一個步驟)工具

        用R讀取excel文件中的數據,須要先搭建一個Java的環境(配置好JDK),而後再用 install.packages("xlsx") 指令導入相關的包(常見的Excel文件格式是xlsx,而處理xlsx文件這個包是使用Java語言來寫的)。可是對於不少小白,可能會出現被配置JDK折騰得勸退的現象。因此,在這裏,我就向你們展現用R語言加載外部文件數據的另外3種更簡單的方法,以下:學習

        例如:我先在桌面(路徑爲:C:\Users\QDM\Desktop)建立一個Excel文件,並手動輸入數據,構造一張9行*4列的數據表,表格內容截圖以下:大數據

                                                                     

 

 

方法①:先按 F12功能鍵 .xlsx另存爲.csv格式的文件,而後用read.csv()函數來讀取該CSV文件中的數據,代碼以下:spa

> x <- read.csv("C:\\Users\\QDM\\Desktop\\銷售業績.csv",header = T)
> x
      品牌   產地 銷售數量      銷售金額
1   布加迪   法國       10  200,000,000 
2 蘭博基尼 意大利       20  160,000,000 
3   法拉利 意大利       30  150,000,000 
4     豐田   日本       40    6,000,000 
5     本田   日本       50   10,000,000 
6     五菱   中國       60    3,000,000 
7     大衆   德國       70   21,000,000 
8     寶馬   德國       80   80,000,000

運行結果截圖:excel

 

方法②:把.xlsx另存爲.txt格式,而後用read.table()函數來讀取該txt文件中的數據,代碼以下:code

> y <- read.table("C:\\Users\\QDM\\Desktop\\銷售業績.txt",header = T)
> y
      品牌   產地 銷售數量      銷售金額
1   布加迪   法國       10  200,000,000 
2 蘭博基尼 意大利       20  160,000,000 
3   法拉利 意大利       30  150,000,000 
4     豐田   日本       40    6,000,000 
5     本田   日本       50   10,000,000 
6     五菱   中國       60    3,000,000 
7     大衆   德國       70   21,000,000 
8     寶馬   德國       80   80,000,000

運行結果截圖:blog

 

方法3:先打開Excel文件,按Ctrl+A快捷鍵全選裏面的內容,接着按Ctrl+C複製(默認複製到剪切板上),如圖:ip

                             

而後在RStudio中輸入如下代碼:數據分析

> z <- read.table("clipboard",header = T,sep = "\t")
> z
      品牌   產地 銷售數量      銷售金額
1   布加迪   法國       10  200,000,000 
2 蘭博基尼 意大利       20  160,000,000 
3   法拉利 意大利       30  150,000,000 
4     豐田   日本       40    6,000,000 
5     本田   日本       50   10,000,000 
6     五菱   中國       60    3,000,000 
7     大衆   德國       70   21,000,000 
8     寶馬   德國       80   80,000,000

運行結果截圖:

 

        結語:做爲一名曾經的「統計學」專業的畢業生,在數據分析崗位上,若是被別人知道只會用Excel,而不會用一門本專業相關的專業工具(如:R語言、SAS語言、SPSS等)處理數據,會有一種很尷尬的感受——可能會很容易被人以爲不學無術。雖然在畢業後,經本人的後天努力自學,掌握了一門更好用的數據分析工具——Python,但爲了避免愧對本身所學過得專業,爲了避免愧對那每一年¥3500的學費,因此感受仍是挺有必要抽時間來學習一下R語言的!

相關文章
相關標籤/搜索