哈嘍你們好,我是可樂
網絡
週日參加了知乎的一個線下活動——快閃課堂
主題:數據會說謊嗎?
主講人:程毅南
ide
主要分享了如何收集到真實的用戶數據並用好這些數據。工具
咱們爲何須要數據,由於要決策,更準確地說,要科學、準確地決策,並解決實際問題。大數據
世界客觀存在,但須要人去發現和認知spa
在這個大數據時代,每時每刻都在產生大量的數據,如何從這麼多數據裏發現有效數據並進行科學地決策,是咱們重點關注的問題。設計
數據是鏈接客觀世界和主觀認知的橋樑,但修橋是個技術活3d
數據客觀地存在,人們對數據的解讀各有千秋,就像一千我的的心中有一千個哈姆雷特同樣,不一樣的人對同一份數據可能都會有不一樣的說法,後面會舉例。orm
獲取數據不難,可是獲取真實、有效的數據,確實沒那麼簡單。好比:blog
人的想法和感覺很難丈量事件
一個簡單的情侶交流問題,就能夠知道人的想法和感覺是很難丈量的,請看下面例子:
小茗同窗:我愛你
可樂:你有多愛我
愛的程度沒法用工具測量
用得分或數字表達,都極易失真,缺少信度
愛的狀態自己就不穩定,可是測量時的狀態卻很重要
愛的感覺能夠對比參照(前女朋友,你媽),但…
你能夠用優美的情話來比喻,但這考驗的就是語文能力,缺少效度。
形成決策失誤
舉三個測量不許致使決策失誤的栗子
感情被騙
好比上面的 我愛你 的案例,對小茗同窗是否愛可樂這件事情若是測量不許,極可能致使可樂遭受嚴重的情感詐騙事件。
美國大選民調翻車
2016年特朗普當選,是美國民調的滑鐵盧,2020年差點又翻車。
對開放二胎的決策
開放二胎後,人口增量顯著低於預期,中國適齡人羣的生育意願到底怎樣,依然是一個有挑戰的問題。
對世界產生認知誤差
舉3個比較難以獲取真實數據的例子
美國大選民調
對於美國大選的預測,你們一直以來都津津樂道,2016年,民調預測希拉里會贏得大選,結果咱們都知道倒是特朗普上臺,今年雖然總體上民調顯示拜登的支持率較高,但在一些搖擺州的預測上仍是打了臉。
因此把數據測量準確這件事情仍是很難的。固然對於民調這種問題,結果不許確更多地可能仍是取樣的誤差?
如何瞭解某種難以啓齒的行爲的***率
如家庭暴力、偷竊、出軌等難以啓齒的行爲,如何瞭解它們的***率?
實際報案的、被警察抓獲的、被他人發現的來這只是一小部分人,或者你能夠說是倖存者誤差,到底有多少人有過相似的行爲?
咱們可能會想到經過如下方式來獲取:
網絡問卷調查。成本低,也沒法覈實用戶身份,但也所以用戶也就能夠隨意說謊
入戶調查、街頭攔訪。也會撒謊,或者很差意思坦白
在居民家安裝監控,排查全部轉帳數據。相似咱們的數據埋點,可能效果好,但不現實。
這裏程老師提供了另一種獲取思路:
抽一張牌,但不告訴我抽到的是什麼?
最後,將回答是的比例減去75%,再除以25%,便是較爲真實的家暴行爲***率。
由於這裏,回答「是」,變成了大機率事件,且這種方法保持了面對面調查卻仍然匿名的方式,結果就較爲真實一些。
調查用戶對微博產品的體驗和感覺
一個真實的案例,說是微博對用戶的滿意度問卷投放數個小時後,評分忽然大幅降低,發生什麼事兒了?
這個案例能夠幫助咱們思考一個問題:
意想不到的數據出現,是有效仍是無效?
前面提到收集數據有那麼多的困難,那麼該如何科學有效地收集數據?
人是愛面子的,會假裝
調整問法,讓他更天然地表達
比起直接問你支持誰,還不如問,你的鄰居支持誰?
巧妙設計,讓他明白真實答案沒有後果
好比,剛剛提到的抽牌匿名法
官方身份,反正大家都知道,說謊沒有意義
好比知乎問你最喜歡看哪些問題?普羅大衆確定以爲,你應該都知道的吧,否則天天給我推送的是啥?
人性是容易服從、容易引導的,要避免從衆壓力
《是,首相》中奸臣作民調就體現了這一點。就「是否支持恢復兵役」的民調是可控制的。在下面一系列「是」的回答後,人們有很大的可能支持恢復兵役。
人性是懶惰的,調查請不要太麻煩
動輒幾十道問卷調查題目真的很讓人頭疼。
人性是千奇百怪的,要儘量包容你所見到的現象
倖存者誤差想必你們已經聽過無數次了,不太瞭解的童鞋能夠在這篇文章中看看。
簡單來講倖存者誤差就是隻能看到通過某種篩選而產生的結果,忽略了被篩選掉的關鍵信息。這個案例告訴咱們用好數據多麼的重要
有什麼方法能測量感情的健康程度
如何測量感情的健康程度?用下面的指標來衡量嗎?
禮物個數
約會次數
陪伴時長
吵架次數
打架次數
仍是那句話,不一樣的人心中有不一樣的評判標準,感情是特指男女仍是包括父母親情?什麼是健康程度?感受又回到了文章一開頭收集數據有什麼難處的問題,人的想法和感覺自己就很難丈量,咱們能夠經過構建不一樣的用戶畫像來具體問題具體分析,主要目的是哪些指標可以幫助咱們作決策。
因此你們也能夠評論區聊聊,有什麼方法能測量感情的健康程度