對小白用戶來講,數據標籤和數據編碼是一對容易混淆的概念,但事實上二者有着本質的區別,想要搞清這兩個概念其實很簡單。下面咱們就來對它們進行一次不折不扣地區分。
git
【1】基礎概念微信
▌數據標籤網站
顧名思義,就是給數據加上標籤。沒有設置標籤的數據,在分析時,會按本來的數值顯示,好比‘1.0’、‘2.0’,這樣就沒有辦法瞭解這些數字本來的含義。編碼
沒有標籤的數據展現效果url
所以爲了方便識別,讓數字具備實際意義,就須要用到數據標籤功能,標識出數字表明的意義。spa
有標籤的數據展現
.net
修改數據標籤對數值本事不會有任何影響,好比這裏的‘1.0’,加上標籤後,顯示爲「男」,即數值1,表明男性,若是改變標籤,數值表明的意思也會隨之改變,但即便換了標籤對本來的數值也不會有影響。3d
▌數據編碼orm
數據編碼是在原始數值的基礎上進行替換,所以對數據從新編碼會改變本來的數據。好比本來的數字是1編碼爲3,意味着數據中的1直接就變成3,再作分析就會按3來分析。blog
【2】操做步驟
▌數據標籤
點擊【數據處理】->【數據標籤】,選擇進行設置標籤的標題,填好對應標籤便可。
(可配合ctrl或者shift鍵同時選擇多項,批量一次性操做處理)
操做演示
設置了數據標籤的標題前,會標有藍色的標籤;沒有標籤的則是灰色的
▌數據編碼
點擊【數據處理】->【數據編碼】,選擇進行編碼的標題,填寫編碼便可。
(可配合ctrl或者shift鍵同時選擇多項,批量一次性操做處理)
操做演示
若是但願直接覆蓋原始數據,請將「覆蓋」按鈕打勾便可
同時下拉複選框,可選擇範圍編碼,針對某一區間的數據編碼成某個數字
【3】應用場景
▌數據標籤
① 針對數據標籤,一般只有「定類」數據須要設置,「定量」數據一般不須要設置。(若是是量表態度題如很是不滿意,比較不滿意,中立,比較滿意,很是滿意,根據須要設置便可)
② 此外涉及下面分析方法時,一般也須要設置數據標籤:
頻數分析
交叉(卡方)分析
方差分析、過後檢驗
T檢驗
多選題
雙因素、多因素方差
Logit迴歸等
▌數據編碼
① 數據編碼可用於數據組合,好比遇到樣本比例嚴重不平衡,能夠將樣本數據組合處理,如1表明高中,2表明大專,3表明本科,4表明碩士,5表明博士。但願組合成三組分別是:本科如下,本科,碩士及以上.則可處理爲:1->1,2->1,3->2,4->3,5->3,最終數字1表明本科如下,2表明本科,3表明碩士及以上
② 數據編碼還可用於反向題處理。好比量表中存在反向題,必定要先給這道題進行反向計分操做,而後再進行具體的分析。
【4】搭配使用
數據編碼和數據標籤在多數狀況下能夠搭配使用。例如,在進行數據上傳時,若是數據中有字符信息,SPSSAU系統會識別字符信息,按照字符順序依次進行標籤設置。
例如:統計分析學生期末成績狀況,原始數據以下圖所示
原始數據
導入系統後,發現系統識別第三列爲字符信息將其編碼爲數字:‘1’=‘不合格’;‘2’=‘優秀’;‘3’=‘合格’;‘4’=‘良好’。原來的字符信息被自動記爲對應數值的數據標籤。
上傳後數據
數據標籤
然而此時數值和標籤順序與想要獲得的順序並不一致,須要經過數據編碼來進行修改,而後再爲新編碼的數值設置標籤。
數據編碼
數據標籤
這樣設置後的數據就能夠直接用於分析了。固然編碼的工做也能夠直接在EXCEL裏完成。
若是是從問卷網站下載的數據,還能夠下載SPSS版本數據再上傳,或者問卷星直接導入,這樣標籤就會自動導入,不須要再額外設置。
本文分享自微信公衆號 - SPSSAU(spssau)。
若有侵權,請聯繫 support@oschina.cn 刪除。
本文參與「OSC源創計劃」,歡迎正在閱讀的你也加入,一塊兒分享。