數據分析小案例(三):調查問卷(python)

數據分析小案例,python實現第二彈~~
python

第一彈戳這裏:數據分析小案例(一):商業街抽獎(python)微信

第二彈戳這裏:數據分析小案例(二):麪包是否是變輕了(python)機器學習


  • 案件回顧學習

傳統吉祥物仍是萌系美少女url

  1. 商業街想設計一個吉祥物作宣傳
    spa

  2. 對商業街店主和顧客發放調查問卷
    .net

  3. 調查問卷的問題中有對吉祥物的偏好調查。也有對商業街的魅力調查,選項包括:活動,促銷,商品齊全和服務態度好。(問題:店主和顧客對這些問題的回答是否有區別?從調查問卷中能夠得到怎樣的運營建議?)設計

  • 數據導入與列聯表3d

將數據存儲爲csv格式,導入python。而且計算顧客和店主對商業街魅力的支持狀況,生成列聯表code

import pandas as pd

#導入數據

survey = pd.read_csv('survey.csv', encoding = 'utf-8')

#計算顧客和店主對商業街魅力的支持狀況

su1 = pd.DataFrame({'顧客':survey[survey.立場=='顧客'].回答6.value_counts()})

su2 = pd.DataFrame({'店主':survey[survey.立場=='店主'].回答6.value_counts()})

#合併數據框,生成列聯表

survey2 = pd.concat([su1,su2],axis=1)

survey2


爲了使觀察更直觀,下面繪製關於列聯表的堆積柱狀圖

import matplotlib.pyplot as plt

from pylab import *  

mpl.rcParams['font.sans-serif'] = ['SimHei']  

survey2.T.plot(kind='bar', stacked=True, color=['black','gold','red','green'], grid=False)

plt.show()

從圖中可直觀看出,店主們比較重視商品是否齊全,顧客們更關注的是實惠。店主們對活動方面花了很多心思,但顧客們興趣不大,反而更注重店家的服務態度。而且,35名顧客對商業街對服務表示滿意,而店主中選擇服務態度好的人數只有9名,必定程度上說明店主對本身的服務態度缺少自信。

雖然能夠從圖中分析出一些結論,但爲了客觀的說明顧客與店主的意見是否存在顯著誤差,要進行獨立性檢驗。


  • 獨立性檢驗(卡方檢驗)

  1. 零假設    店主與顧客的回答是獨立的,即無顯著不一樣

  2. 備擇假設    店主與顧客的回答意見受各自立場影響,即意見不一樣

  3. 機率不足顯著性水平(5%)    否認零假設,即顧客與店主的意見是否存在顯著誤差

  4. 機率等於或超過顯著性水平(5%)    保留零假設,即顧客與店主的意見不受各自立場影響

from scipy.stats import chi2_contingency

chi2_contingency(survey2)

 
  

結果爲:

(55.488971138570164, 5.3999746517395078e-12, 3, array([[ 25.36945813,  24.63054187],        [ 30.44334975,  29.55665025],        [ 22.32512315,  21.67487685],        [ 24.86206897,  24.13793103]]))

其中,第一個值表明卡方值,第二個值表明pvalue,即機率,第三個值表明自由度。這裏機率值幾乎等於零,顯然不足5%,所以,店主與顧客對商業街的期待有所不一樣


接下來分析顧客和店主對吉祥物的選擇上是否有分歧。

su11 = pd.DataFrame({'顧客':survey[survey.立場=='顧客'].回答7.value_counts()})

su22 = pd.DataFrame({'店主':survey[survey.立場=='店主'].回答7.value_counts()})

survey3 = pd.concat([su11.T,su22.T],axis=0)

survey3

明顯,顧客和店主的意見有分歧。沒填答案的顧客太多,且幾乎全部店主都選擇了萌系美少女,選傳統吉祥物的只有3人,數據分析中,存在不足5的頻數,要儘可能避免使用卡方檢驗。顧客回答兩邊基本同樣多,且不少人沒有填答案,證實顧客對這個不感興趣。結合回答6的分析,顧客更期待的是促銷。所以,與其設計吉祥物,不如搞一些打折促銷的活動


  • 幾個小概念

獨立性檢驗:分析列聯表2個屬性之間是否存在關聯性的方法。首先提出零假設,「兩個屬性相互獨立」,即不具備關聯性。若是機率不足5%,則拋棄零假設,選取備擇假設,即「2個屬性不相互獨立」。若是機率大於等於5%,保留零假設。


後臺回覆「麪包」,可得到本例中數據


機器學習養成記

搜索添加微信公衆號:chenchenwings

長按圖片,識別二維碼,關注咱們。

如需轉載,請在開篇顯著位置註明做者和出處,並在文末放置機器學習養成記二維碼和添加原文連接。


快來關注咱們吧!

本文分享自微信公衆號 - 機器學習養成記(chenchenwings)。
若有侵權,請聯繫 support@oschina.cn 刪除。
本文參與「OSC源創計劃」,歡迎正在閱讀的你也加入,一塊兒分享。

相關文章
相關標籤/搜索