數據會說謊的真實例子有哪些

哈嘍你們好,我是可樂
網絡

週日參加了知乎的一個線下活動——快閃課堂
主題:數據會說謊嗎?
主講人:程毅南
ide

image.png
爲了不遺忘,因此將內容整理並附帶我本身的理解,和你們分享。

主要分享了如何收集到真實的用戶數據用好這些數據工具

咱們爲何須要數據

咱們爲何須要數據,由於要決策,更準確地說,要科學、準確地決策,並解決實際問題。大數據

什麼是科學地蒐集數據

  • 世界客觀存在,但須要人去發現和認知spa

在這個大數據時代,每時每刻都在產生大量的數據,如何從這麼多數據裏發現有效數據並進行科學地決策,是咱們重點關注的問題。設計

  • 數據是鏈接客觀世界和主觀認知的橋樑,但修橋是個技術活3d

數據客觀地存在,人們對數據的解讀各有千秋,就像一千我的的心中有一千個哈姆雷特同樣,不一樣的人對同一份數據可能都會有不一樣的說法,後面會舉例。orm

蒐集數據有什麼難處

獲取數據不難,可是獲取真實、有效的數據,確實沒那麼簡單。好比:blog

  • 人的想法和感覺很難丈量事件

一個簡單的情侶交流問題,就能夠知道人的想法和感覺是很難丈量的,請看下面例子:

小茗同窗:我愛你
可樂:你有多愛我

image.png
爲何我愛你很難回答,由於
  • 愛的程度沒法用工具測量

  • 用得分或數字表達,都極易失真,缺少信度

  • 愛的狀態自己就不穩定,可是測量時的狀態卻很重要

  • 愛的感覺能夠對比參照(前女朋友,你媽),但…

  • 你能夠用優美的情話來比喻,但這考驗的就是語文能力,缺少效度

測量不許有什麼問題

  1. 形成決策失誤
    舉三個測量不許致使決策失誤的栗子

  • 感情被騙

好比上面的 我愛你 的案例,對小茗同窗是否愛可樂這件事情若是測量不許,極可能致使可樂遭受嚴重的情感詐騙事件。

  • 美國大選民調翻車

2016年特朗普當選,是美國民調的滑鐵盧,2020年差點又翻車。

  • 對開放二胎的決策

開放二胎後,人口增量顯著低於預期,中國適齡人羣的生育意願到底怎樣,依然是一個有挑戰的問題。

  1. 對世界產生認知誤差

測量準確到底有多難

舉3個比較難以獲取真實數據的例子

  1. 美國大選民調

對於美國大選的預測,你們一直以來都津津樂道,2016年,民調預測希拉里會贏得大選,結果咱們都知道倒是特朗普上臺,今年雖然總體上民調顯示拜登的支持率較高,但在一些搖擺州的預測上仍是打了臉。

因此把數據測量準確這件事情仍是很難的。固然對於民調這種問題,結果不許確更多地可能仍是取樣的誤差?image.png

  1. 如何瞭解某種難以啓齒的行爲的***率

如家庭暴力、偷竊、出軌等難以啓齒的行爲,如何瞭解它們的***率?

實際報案的、被警察抓獲的、被他人發現的來這只是一小部分人,或者你能夠說是倖存者誤差,到底有多少人有過相似的行爲?

咱們可能會想到經過如下方式來獲取:

  • 網絡問卷調查。成本低,也沒法覈實用戶身份,但也所以用戶也就能夠隨意說謊

  • 入戶調查、街頭攔訪。也會撒謊,或者很差意思坦白

  • 在居民家安裝監控,排查全部轉帳數據。相似咱們的數據埋點,可能效果好,但不現實。

這裏程老師提供了另一種獲取思路:

抽一張牌,但不告訴我抽到的是什麼?

圖片
問被訪者:是否打過本身的伴侶
若是抽到 黑桃,則能夠隨心回答
若是抽到除 黑桃外的其餘3種花色,則 只能回答是

最後,將回答是的比例減去75%,再除以25%,便是較爲真實的家暴行爲***率。

由於這裏,回答「是」,變成了大機率事件,且這種方法保持了面對面調查卻仍然匿名的方式,結果就較爲真實一些。

  1. 調查用戶對微博產品的體驗和感覺

一個真實的案例,說是微博對用戶的滿意度問卷投放數個小時後,評分忽然大幅降低,發生什麼事兒了?

圖片
結果發現是飯圈水軍,「 咱們給新浪微博打差評,讓騰訊微博復活,給新浪點顏色看看

圖片

這個案例能夠幫助咱們思考一個問題:

意想不到的數據出現,是有效仍是無效

如何作好測量

前面提到收集數據有那麼多的困難,那麼該如何科學有效地收集數據?

避免假裝

人是愛面子的,會假裝

  • 調整問法,讓他更天然地表達

比起直接問你支持誰,還不如問,你的鄰居支持誰?

  • 巧妙設計,讓他明白真實答案沒有後果

好比,剛剛提到的抽牌匿名法

  • 官方身份,反正大家都知道,說謊沒有意義

好比知乎問你最喜歡看哪些問題?普羅大衆確定以爲,你應該都知道的吧,否則天天給我推送的是啥?

避免從衆

人性是容易服從、容易引導的,要避免從衆壓力

《是,首相》中奸臣作民調就體現了這一點。就「是否支持恢復兵役」的民調是可控制的。在下面一系列「是」的回答後,人們有很大的可能支持恢復兵役。image.png


但換一種問法也是能夠的
圖片
所以不一樣的問卷調查方法,可能會獲得不一樣的結果,要避免給人 從衆的壓力。

避免複雜

人性是懶惰的,調查請不要太麻煩

動輒幾十道問卷調查題目真的很讓人頭疼。

包容

人性是千奇百怪的,要儘量包容你所見到的現象

如何用好數據

倖存者誤差想必你們已經聽過無數次了,不太瞭解的童鞋能夠在這篇文章中看看。

圖片

數據分析中會常犯哪些錯誤,如何解決?


簡單來講倖存者誤差就是隻能看到通過某種篩選而產生的結果,忽略了被篩選掉的關鍵信息。這個案例告訴咱們用好數據多麼的重要

圖片

一個問題

有什麼方法能測量感情的健康程度

如何測量感情的健康程度?用下面的指標來衡量嗎?

  • 禮物個數

  • 約會次數

  • 陪伴時長

  • 吵架次數

  • 打架次數

仍是那句話,不一樣的人心中有不一樣的評判標準,感情是特指男女仍是包括父母親情?什麼是健康程度?感受又回到了文章一開頭收集數據有什麼難處的問題,人的想法和感覺自己就很難丈量,咱們能夠經過構建不一樣的用戶畫像來具體問題具體分析,主要目的是哪些指標可以幫助咱們作決策。

因此你們也能夠評論區聊聊,有什麼方法能測量感情的健康程度

相關文章
相關標籤/搜索