數據分析小案例,python實現第二彈~~
python
第一彈戳這裏:數據分析小案例(一):商業街抽獎(python)微信
第二彈戳這裏:數據分析小案例(二):麪包是否是變輕了(python)機器學習
案件回顧學習
傳統吉祥物仍是萌系美少女url
商業街想設計一個吉祥物作宣傳
spa對商業街店主和顧客發放調查問卷
.net調查問卷的問題中有對吉祥物的偏好調查。也有對商業街的魅力調查,選項包括:活動,促銷,商品齊全和服務態度好。(問題:店主和顧客對這些問題的回答是否有區別?從調查問卷中能夠得到怎樣的運營建議?)設計
數據導入與列聯表3d
將數據存儲爲csv格式,導入python。而且計算顧客和店主對商業街魅力的支持狀況,生成列聯表。code
import pandas as pd
#導入數據
survey = pd.read_csv('survey.csv', encoding = 'utf-8')
#計算顧客和店主對商業街魅力的支持狀況
su1 = pd.DataFrame({'顧客':survey[survey.立場=='顧客'].回答6.value_counts()})
su2 = pd.DataFrame({'店主':survey[survey.立場=='店主'].回答6.value_counts()})
#合併數據框,生成列聯表
survey2 = pd.concat([su1,su2],axis=1)
survey2
爲了使觀察更直觀,下面繪製關於列聯表的堆積柱狀圖。
import matplotlib.pyplot as plt
from pylab import *
mpl.rcParams['font.sans-serif'] = ['SimHei']
survey2.T.plot(kind='bar', stacked=True, color=['black','gold','red','green'], grid=False)
plt.show()
從圖中可直觀看出,店主們比較重視商品是否齊全,顧客們更關注的是實惠。店主們對活動方面花了很多心思,但顧客們興趣不大,反而更注重店家的服務態度。而且,35名顧客對商業街對服務表示滿意,而店主中選擇服務態度好的人數只有9名,必定程度上說明店主對本身的服務態度缺少自信。
雖然能夠從圖中分析出一些結論,但爲了客觀的說明顧客與店主的意見是否存在顯著誤差,要進行獨立性檢驗。
獨立性檢驗(卡方檢驗)
零假設 店主與顧客的回答是獨立的,即無顯著不一樣
備擇假設 店主與顧客的回答意見受各自立場影響,即意見不一樣
機率不足顯著性水平(5%) 否認零假設,即顧客與店主的意見是否存在顯著誤差
機率等於或超過顯著性水平(5%) 保留零假設,即顧客與店主的意見不受各自立場影響
from scipy.stats import chi2_contingency
chi2_contingency(survey2)
結果爲:
(55.488971138570164, 5.3999746517395078e-12, 3, array([[ 25.36945813, 24.63054187], [ 30.44334975, 29.55665025], [ 22.32512315, 21.67487685], [ 24.86206897, 24.13793103]]))
其中,第一個值表明卡方值,第二個值表明pvalue,即機率,第三個值表明自由度。這裏機率值幾乎等於零,顯然不足5%,所以,店主與顧客對商業街的期待有所不一樣。
接下來分析顧客和店主對吉祥物的選擇上是否有分歧。
su11 = pd.DataFrame({'顧客':survey[survey.立場=='顧客'].回答7.value_counts()})
su22 = pd.DataFrame({'店主':survey[survey.立場=='店主'].回答7.value_counts()})
survey3 = pd.concat([su11.T,su22.T],axis=0)
survey3
明顯,顧客和店主的意見有分歧。沒填答案的顧客太多,且幾乎全部店主都選擇了萌系美少女,選傳統吉祥物的只有3人,數據分析中,存在不足5的頻數,要儘可能避免使用卡方檢驗。顧客回答兩邊基本同樣多,且不少人沒有填答案,證實顧客對這個不感興趣。結合回答6的分析,顧客更期待的是促銷。所以,與其設計吉祥物,不如搞一些打折促銷的活動。
幾個小概念
獨立性檢驗:分析列聯表2個屬性之間是否存在關聯性的方法。首先提出零假設,「兩個屬性相互獨立」,即不具備關聯性。若是機率不足5%,則拋棄零假設,選取備擇假設,即「2個屬性不相互獨立」。若是機率大於等於5%,保留零假設。
後臺回覆「麪包」,可得到本例中數據
機器學習養成記
搜索添加微信公衆號:chenchenwings
長按圖片,識別二維碼,關注咱們。
如需轉載,請在開篇顯著位置註明做者和出處,並在文末放置機器學習養成記二維碼和添加原文連接。
快來關注咱們吧!
本文分享自微信公衆號 - 機器學習養成記(chenchenwings)。
若有侵權,請聯繫 support@oschina.cn 刪除。
本文參與「OSC源創計劃」,歡迎正在閱讀的你也加入,一塊兒分享。