Excel是咱們工做中常用的一種工具,對於數據分析來講,這也是處理數據最基礎的工具。java
本文對數據分析須要用到的函數作了分類,而且有詳細的例子說明,文章已作了書籤處理,點擊可跳轉至相應位置。數組
函數分類:函數
常常性的,須要的數據不在同一個excel表或同一個excel表不一樣sheet中,數據太多,copy麻煩也不許確,如何整合呢?這類函數就是用於多表關聯或者行列比對時的場景,並且表越複雜,用得越多。數據分析
包含函數:VLOOKUP、HLOOKUP、INDEX、MATCH、RANK、Row、Column、Offset
功能:用於查找首列知足條件的元素。
語法:=VLOOKUP(要查找的值,要在其中查找值的區域,區域中包含返回值的列號,精確匹配(0)或近似匹配(1) )。
(1) 單表查找
把選手Tian的戰隊找到以後,接下來把鼠標放到G8單元格右下角位置,出現十字符號後往下拉,Excel會根據單元格的變化自動填充G9和G10單元格的公式。
(2) 跨多工做表查找
假設我有一個工資表格文件,裏面每一個部門有一張表,有4個部門對應的部門工資表和一個須要查詢工資的查詢表,爲方便說明這裏的姓名取方便識別的編號,你也能夠用真正的姓名。
在查詢表中,要求根據提供的姓名,從銷售~人事4個工做表中查詢該員工的基本工資。
若是,咱們知道A1是銷售部的,那麼公式能夠寫爲:=VLOOKUP(A2,銷售!A:C,3,0)
若是,咱們知道A1可能在銷售或財務表這2個表中,公式能夠寫爲:=IFERROR(VLOOKUP(A2,銷售!A:C,3,0),VLOOKUP(A2,財務!A:C,3,0))
意思是,若是在銷售表中查找不到(用IFERROR函數判斷),則去財務表中再查找。
若是,咱們知道A1可能在銷售、財務或服務表中,公式能夠再次改成:=IFERROR(VLOOKUP(A2,銷售!A:C,3,0),IFERROR(VLOOKUP(A2,財務!A:C,3,0),VLOOKUP(A2,服務!A:C,3,0)))
若是,有更多的表,如本例中4個表,那就一層層的套用下去,若是4個表都查不到就設置爲"無此人信息":=IFERROR(VLOOKUP(A2,銷售!A:C,3,0),IFERROR(VLOOKUP(A2,財務!A:C,3,0),IFERROR(VLOOKUP(A2,服務!A:C,3,0),IFERROR(VLOOKUP(A2,人事!A:C,3,0),"無此人信息"))))
當查找的值位於查找範圍的首行,而且返回的值在查找範圍的第幾行,可使用 hlookup 函數
語法:=HLOOKUP(要查找的值,查找的範圍,返回的值在查找範圍的第幾行,精確匹配(0)或近似匹配(1) )。
區別:HLOOKUP按行查找,返回的值與須要查找的值在同一列上,VLOOKUP按列查找,返回的值與須要查找的值在同一行上。
在Excel中,除了VLOOKUP函數經常使用來查找引用外,INDEX函數和MATCH函數組合也可用來作查找引用工做,這組函數有效彌補了VLOOKUP函數查找目標不在查找範圍數據首列的缺陷。
功能:返回表格或區域中的值。
語法:= INDEX(要返回值的單元格區域或數組,所在行,所在列)
功能:用於返回指定內容在指定區域(某行或者某列)的位置。
語法:= MATCH (要查找的值,查找的區域,查找方式),查找方式0爲等於查找值,1爲小於查找值,-1爲大於查找值
功能:求某一個數值在某一區域內的數值排名。
語法:=RANK(參與排名的數值, 排名的數值區域, 排名方式-0是降序-1是升序-默認爲0)。
功能:返回單元格所在的行
語法:ROW()或ROW(某個單元格)
功能:返回單元格所在的列
語法:COLUMN()或COLUMN(某個單元格)
功能:從指定的基準位置按行列偏移量返回指定的引用
語法:=Offset(指定點,偏移多少行(正數向下,負數向上),偏移多少列(正數向右,負數向左),返回多少行,返回多少列)
數據處理以前,須要對提取的數據進行初步清洗,如清除字符串空格,合併單元格、替換、截取字符串、查找字符串出現的位置等。
清除字符串先後空格:使用Trim
合併單元格:使用concatenate
替換單元格中內容:Replace/Substitute
功能:主要用於把單元格內容先後的空格去掉,但並不去除字符之間的空格,若是是想要去掉全部的空格,須要用substitute函數。。
語法:=TRIM(單元格)
語法:=Concatenate(單元格1,單元格2……)
合併單元格中的內容,還有另外一種合併方式是&,須要合併的內容過多時,concatenate效率更快。
功能:從左截取字符串
語法:=Left(值所在單元格,截取長度)
功能:從右截取字符串
語法:= Right (值所在單元格,截取長度)
功能:從中間截取字符串
語法:= Mid(指定字符串,開始位置,截取長度)
Text函數表示將數值轉化爲本身想要的文本格式,語法=TEXT(value,format_text)
功能:替換掉單元格的字符串
語法:=Replace(指定字符串,哪一個位置開始替換,替換幾個字符,替換成什麼)
和replace接近,不一樣在於Replace根據位置實現替換,須要提供從第幾位開始替換,替換幾位,替換後的新的文本;
而Substitute根據文本內容替換,須要提供替換的舊文本和新文本,以及替換第幾個舊文本等。所以Replace實現固定位置的文本替換,Substitute實現固定文本替換。
功能:查找文本位置
語法:=Find(要查找字符,指定字符串,從第幾個字符開始查起)
功能:返回一個指定字符或文本字符串在字符串中第一次出現的位置 ,從左到右查找
語法:=search(要查找的字符,字符所在的文本,從第幾個字符開始查找)
Find和Search這兩個函數功能幾乎相同,實現查找字符所在的位置,區別在於Find函數精確查找,區分大小寫;Search函數模糊查找,不區分大小寫。
功能:返回字符串的字符數
語法:=LEN(字符串)
字符串是指包含數字、字母、符號等的一串字符。
功能:返回字符串的字節數。
區別在於,len是按字符數計算的,lenb是按字節數計算的。數字、字母、英文、標點符號(半角狀態下輸入的哦)都是按1計算的,漢字、全角狀態下的標點符號,每一個字符按2計算。
綜合應用
=IF(OR(COUNTIF(A1,"*"&{"Python","java"}&"*")),A1,"0")
若是含有字段Python或java中的任何一個則爲自己,不然爲"0",* 表明任意內容,以後就能夠經過Excel的篩選功能,把B列的"0"篩選掉。
功能:使用邏輯函數 IF 函數時,若是條件爲真,該函數將返回一個值;若是條件爲假,函數將返回另外一個值。
語法:=IF(條件, true時返回值, false返回值)
功能:邏輯判斷,至關於「並」,"&"。
語法:所有參數爲True,則返回True,常常用於多條件判斷。
功能:邏輯判斷,至關於「或」。
語法:只要參數有一個True,則返回Ture,常常用於多條件判斷。
在利用excel表格統計數據時,經常須要使用各類excel自帶的公式,也是最常使用的一類。重要性不言而喻。不過excel都自帶快捷功能。
MIN函數:找到某區域中的最小值
MAX函數:找到某區域中的最大值
AVERAGE函數:計算某區域中的平均值
COUNT函數: 計算某區域中包含數字的單元格的數目
COUNTIF函數:計算某個區域中知足給定條件的單元格數目
COUNTIFS函數:統計一組給定條件所指定的單元格數
SUM函數:計算單元格區域中全部數值的和
SUMIF函數:對知足條件的單元格求和
SUMPRODUCT函數:返回相應的數組或區域乘積的和
功能:找到某區域中的最小值
功能:找到某區域中的最大值
功能:計算某區域中的平均值
功能:計算純數字的單元格的個數。
功能:計算某個區域中知足給定條件的單元格數目
語法:=COUNTIF(單元格1: 單元格2 ,條件)
功能:統計一組給定條件所指定的單元格數
語法:=COUNTIFS(第一個條件區域,第一個對應的條件,第二個條件區域,第二個對應的條件,第N個條件區域,第N個對應的條件)
計算單元格區域中全部數值的和
功能:求知足條件的單元格和
語法:=SUMIF(單元格1: 單元格2 ,條件,單元格3: 單元格4)
功能:返回相應的數組或區域乘積的和
語法: =SUMPRODUCT(單元格1: 單元格2 ,單元格3: 單元格4)
統計型函數,求標準差,衡量離散程度。
語法:=Subtotal(參數,區域)
彙總型函數,將平均值、計數、最大最小、相乘、標準差、求和、方差等參數化,換言之,只要會了這個函數,上面的均可以拋棄掉了。
爲 1 到 11(包含隱藏值)或 101 到 111(忽略隱藏值)之間的數字,指定使用何種函數在列表中進行分類彙總計算。
取整函數,int取整(去掉小數),round按小數位取數(四捨五入)。
語法:ROUND(數值, 位數)
round(3.1415,2)=3.14 ;
round(3.1415,1)=3.1
專門用於處理時間格式以及轉換。
TODAY函數:返回今天的日期,動態函數。
NOW函數:返回當前的時間,動態函數。
功能:返回今天的日期,動態函數。
功能:返回當前的日期和時間,動態函數。
語法:=NOW()
功能:返回日期的年份。
語法:=YEAR(日期)
功能:返回日期的月份。
語法:=MONTH(日期)
功能:返回以序列數表示的某日期的天數。
語法:=DAY(日期)
功能:返回對應於某個日期的一週中的第幾天。 默認狀況下, 1(星期日)到 7(星期六)範圍內的整數。
語法:=Weekday(指定時間,參數),參數設爲2,則星期一爲1,星期日爲7
功能:計算兩個日期之間相隔的天數、月數或年數。
語法:=Datedif(開始日期,結束日期,參數)
參數3:爲所需信息的返回時間單位代碼。各代碼含義以下:
"y"返回時間段中的全年數
"m」返回時間段中的整月數
"d"返回時間段中的天數
"md」參數1和2的天數之差,忽略年和月
"ym「參數1和2的月數之差,忽略年和日
"yd」參數1和2的天數之差,忽略年。按照月、日計算天數