數據會說謊的真實例子有哪些

時間 2021-01-31

標籤網絡 ide 工具大數據 spa 設計 3d orm blog 事件欄目系統網絡简体版

原文原文鏈接

哈嘍你們好，我是可樂
網絡

週日參加了知乎的一個線下活動——快閃課堂
主題：數據會說謊嗎？
主講人：程毅南
ide

爲了不遺忘，因此將內容整理並附帶我本身的理解，和你們分享。

主要分享了如何收集到真實的用戶數據並用好這些數據。工具

咱們爲何須要數據

咱們爲何須要數據，由於要決策，更準確地說，要科學、準確地決策，並解決實際問題。大數據

什麼是科學地蒐集數據

世界客觀存在，但須要人去發現和認知spa

在這個大數據時代，每時每刻都在產生大量的數據，如何從這麼多數據裏發現有效數據並進行科學地決策，是咱們重點關注的問題。設計

數據是鏈接客觀世界和主觀認知的橋樑，但修橋是個技術活3d

數據客觀地存在，人們對數據的解讀各有千秋，就像一千我的的心中有一千個哈姆雷特同樣，不一樣的人對同一份數據可能都會有不一樣的說法，後面會舉例。orm

蒐集數據有什麼難處

獲取數據不難，可是獲取真實、有效的數據，確實沒那麼簡單。好比：blog

人的想法和感覺很難丈量事件

一個簡單的情侶交流問題，就能夠知道人的想法和感覺是很難丈量的，請看下面例子：

小茗同窗：我愛你
可樂：你有多愛我

爲何我愛你很難回答，由於

愛的程度沒法用工具測量
用得分或數字表達，都極易失真，缺少信度
愛的狀態自己就不穩定，可是測量時的狀態卻很重要
愛的感覺能夠對比參照（前女朋友，你媽），但…
你能夠用優美的情話來比喻，但這考驗的就是語文能力，缺少效度。

測量不許有什麼問題

形成決策失誤
舉三個測量不許致使決策失誤的栗子

感情被騙

好比上面的我愛你的案例，對小茗同窗是否愛可樂這件事情若是測量不許，極可能致使可樂遭受嚴重的情感詐騙事件。

美國大選民調翻車

2016年特朗普當選，是美國民調的滑鐵盧，2020年差點又翻車。

對開放二胎的決策

開放二胎後，人口增量顯著低於預期，中國適齡人羣的生育意願到底怎樣，依然是一個有挑戰的問題。

對世界產生認知誤差

測量準確到底有多難

舉3個比較難以獲取真實數據的例子

美國大選民調

對於美國大選的預測，你們一直以來都津津樂道，2016年，民調預測希拉里會贏得大選，結果咱們都知道倒是特朗普上臺，今年雖然總體上民調顯示拜登的支持率較高，但在一些搖擺州的預測上仍是打了臉。

因此把數據測量準確這件事情仍是很難的。固然對於民調這種問題，結果不許確更多地可能仍是取樣的誤差？

如何瞭解某種難以啓齒的行爲的***率

如家庭暴力、偷竊、出軌等難以啓齒的行爲，如何瞭解它們的***率？

實際報案的、被警察抓獲的、被他人發現的來這只是一小部分人，或者你能夠說是倖存者誤差，到底有多少人有過相似的行爲？

咱們可能會想到經過如下方式來獲取：

網絡問卷調查。成本低，也沒法覈實用戶身份，但也所以用戶也就能夠隨意說謊
入戶調查、街頭攔訪。也會撒謊，或者很差意思坦白
在居民家安裝監控，排查全部轉帳數據。相似咱們的數據埋點，可能效果好，但不現實。

這裏程老師提供了另一種獲取思路：

抽一張牌，但不告訴我抽到的是什麼？

問被訪者：是否打過本身的伴侶
若是抽到黑桃，則能夠隨心回答
若是抽到除 黑桃外的其餘3種花色，則 只能回答是

最後，將回答是的比例減去75%，再除以25%，便是較爲真實的家暴行爲***率。

由於這裏，回答「是」，變成了大機率事件，且這種方法保持了面對面調查卻仍然匿名的方式，結果就較爲真實一些。

調查用戶對微博產品的體驗和感覺

一個真實的案例，說是微博對用戶的滿意度問卷投放數個小時後，評分忽然大幅降低，發生什麼事兒了？

結果發現是飯圈水軍，「 咱們給新浪微博打差評，讓騰訊微博復活，給新浪點顏色看看」

這個案例能夠幫助咱們思考一個問題：

意想不到的數據出現，是有效仍是無效？

如何作好測量

前面提到收集數據有那麼多的困難，那麼該如何科學有效地收集數據？

避免假裝

人是愛面子的，會假裝

調整問法，讓他更天然地表達

比起直接問你支持誰，還不如問，你的鄰居支持誰？

巧妙設計，讓他明白真實答案沒有後果

好比，剛剛提到的抽牌匿名法

官方身份，反正大家都知道，說謊沒有意義

好比知乎問你最喜歡看哪些問題？普羅大衆確定以爲，你應該都知道的吧，否則天天給我推送的是啥？

避免從衆

人性是容易服從、容易引導的，要避免從衆壓力

《是，首相》中奸臣作民調就體現了這一點。就「是否支持恢復兵役」的民調是可控制的。在下面一系列「是」的回答後，人們有很大的可能支持恢復兵役。

但換一種問法也是能夠的

所以不一樣的問卷調查方法，可能會獲得不一樣的結果，要避免給人從衆的壓力。

避免複雜

人性是懶惰的，調查請不要太麻煩

動輒幾十道問卷調查題目真的很讓人頭疼。

包容

人性是千奇百怪的，要儘量包容你所見到的現象

如何用好數據

倖存者誤差想必你們已經聽過無數次了，不太瞭解的童鞋能夠在這篇文章中看看。

數據分析中會常犯哪些錯誤，如何解決？

簡單來講倖存者誤差就是隻能看到通過某種篩選而產生的結果，忽略了被篩選掉的關鍵信息。這個案例告訴咱們用好數據多麼的重要

一個問題

有什麼方法能測量感情的健康程度

如何測量感情的健康程度？用下面的指標來衡量嗎？

禮物個數
約會次數
陪伴時長
吵架次數
打架次數

仍是那句話，不一樣的人心中有不一樣的評判標準，感情是特指男女仍是包括父母親情？什麼是健康程度？感受又回到了文章一開頭收集數據有什麼難處的問題，人的想法和感覺自己就很難丈量，咱們能夠經過構建不一樣的用戶畫像來具體問題具體分析，主要目的是哪些指標可以幫助咱們作決策。

因此你們也能夠評論區聊聊，有什麼方法能測量感情的健康程度

相關標籤/搜索

每日一句

每一个你不满意的现在，都有一个你没有努力的曾经。