分析Airbnb數據後,發現互聯網平臺加重了線下偏見!

watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_90,type_ZmFuZ3poZW5naGVpdGk=

導語網絡

Offline biases in online platformsapp

——a study of diversity and homophily in Airbnb機器學習

watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_90,type_ZmFuZ3poZW5naGVpdGk=

背景ide

共享經濟平臺是世紀舊現象的新表現。長期以來,跳蚤市場、二手店等一直充當着促進消費者之間未充分利用的商品或服務的資源交換系統。然而,過去小規模和本地協做消費市場如今已成爲龐大的在線市場,其中面對面的互動已被新技術所取代。學習

  watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_90,type_ZmFuZ3poZW5naGVpdGk=

 

存在的問spa

分散的、基本上不受監管的在線平臺,一般被認爲是一個平等競爭的領域,全部參與者都得到相同的機會,共享經濟平臺最終可能成爲線下人類偏見的線上聚合器。3d

 

事實上,許多研究代表,一些大型共享經濟平臺正在加速大城市中高檔化的現象。例如,Airbnb致使紐約市不一樣地區之間出現了短租租金差距(使用airbnb的房產出租的價格相對更高),並加重了洛杉磯的經濟適用房危機。反過來,這些現象一般放大了種族之間預先存在的分歧,滋長了Airbnb社區與在Airbnb有重要存在的相鄰社區之間的不平等。orm

 

研究內容blog

 

01ci

數聽說明

數據來自於 InsideAirbnb,包含阿姆斯特丹、芝加哥、都柏林、香港和納什維爾五個城市2008年-2016年(納什維爾從2009年開始)的房主、房產與客戶信息。

 

具體的數量以下:

watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_90,type_ZmFuZ3poZW5naGVpdGk=

 

02

研究方法

做者將airbnb的房主與客戶模型化爲二部圖(bi-partite graph)的節點,他們之間用有向邊g→h鏈接,邊的權重w爲客戶在房主那裏停留的次數。並根據城市與房型(整租型與共享型)建立了共5*2張二部圖。

 

做者先作一個零假設:客戶與房主是隨機匹配的。根據這一假設,做者經過對原始網絡的邊進行重連邊來建立一個零假設網絡,用這個網絡與根據實際經驗生成的網絡來對比,驗證零假設是否成立。

  watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_90,type_ZmFuZ3poZW5naGVpdGk=

03

研究發現

 

在性別方面,房主與不一樣性別的客戶之間的交互差別與城市相關。做者發現,在某些城市(如阿姆斯特丹)同性別之間的交互更加廣泛,而另一些城市(如納什維爾)異性別之間的交互更加廣泛。固然這和各個城市airbnb的用戶構成也有關係。

 

在加入住房屬性(整租型與共享型)後,做者發現全部城市的整租型房產都趨向於同性別之間的交互,共享型則在不一樣城市有不一樣表現,在都柏林趨向於異性,在納什維爾的表現則與零假設相同,沒有特別的趨向。

  watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_90,type_ZmFuZ3poZW5naGVpdGk=

在種族方面,這種差別相比性別來講沒有那麼大,但仍有統計學上的顯著差別。在全部城市裏房主與客戶都傾向於同種族,在香港會更加明顯。爲驗證是不是種族背後隱藏的經濟水平致使的差別,做者加入了房主與客戶的財富屬性,仍然獲得了上述的結果。

watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_90,type_ZmFuZ3poZW5naGVpdGk=

      

在年齡方面,做者沒有獲得顯著的統計學差別。但airbnb用戶的年齡與當地人口結構相比更加的年輕化。

04

總結

    

做者的研究結果代表,在全部受研究的城市中,某些用戶羣體(如年輕、白人、女性)與當地人口相比,所佔比例大大高於當地人口;此外,在全部城市,不管房產租賃類型如何,都檢測到性別和種族的趨同性具備顯著性的統計差別。

 

watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_90,type_ZmFuZ3poZW5naGVpdGk=

 

做者研究的一些侷限:

 

做者數據中的性別、年齡與種族是由房主和客戶的照片經過機器學習模型識別出來的,做者經過多種模型交叉驗證使研究結果基本可靠;房主與客戶之間的聯繫是由公開的評論獲得的,沒法獲得那些入住後沒有評論的交互,和那些被拒絕或者被取消的交易。這些內容有可能影響最後的結果。

 

watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_90,type_ZmFuZ3poZW5naGVpdGk=

- DataCastle -

 

watermark,size_16,text_QDUxQ1RP5Y2a5a6i,color_FFFFFF,t_100,g_se,x_10,y_10,shadow_90,type_ZmFuZ3poZW5naGVpdGk=

相關文章
相關標籤/搜索