應學習之需,最近一段時間閱讀了一篇論文,特寫下總結,如有紕漏,還望指出。算法
目錄安全
1.1 爲何要了解移動用戶的隱私指望服務器
一、移動設備的普遍使用存在一些潛在的隱私威脅和信息泄漏。 架構
二、系統供應商針對這個問題已經提出了相應措施,例如:蘋果的iOS系統可讓用戶控制應用是否能夠訪問特定的敏感數據源。Android平臺一樣也有相似的細粒度權限控制機制。然而,存在自身缺點:不包括全部的用戶都具有知識背景可以正確地進行隱私配置。同時是一項乏味且具備挑戰性的工做。用戶體驗不高。 框架
三、沒有一個簡單的規則能夠知足全部對於隱私的要求,有些人可能願意爲更好的服務和體驗提供一些信息,而另外一些人可能不肯意由於隱私問題而分享敏感數據。爲了達到每一個用戶的最佳平衡,理解他們對隱私的指望,並幫助他們相應地設置隱私許可顯得相當重要。這也是之因此不採用後面講到的安全專家建議的緣由。函數
1.2 什麼是Crowdsourcing方法和PriWe系統學習
此方法基於一些關鍵的看法,即用戶如何決定爲某個應用程序授予權限的: spa
一、這一決定取決於用戶的特定隱私偏好或關注(與後面提到的「基於用戶」相對應); 設計
二、這一決定與用戶對某些應用的指望有關(與後面提到的「基於事項」相對應)。 3d
文章提出的方法首先是在用戶對應用的隱私偏好和隱私指望之間進行比較,而後根據這些類似性向用戶推薦合適的權限設置。方法背後的基本原理是:那些在某些私人數據和/或隱私指望有相似偏好的用戶更有可能在相關的隱私項目中做出相似的決定。追求可用性和隱私之間的平衡。
PriWe架構:首先,PriWe能夠幫助用戶在本身的智能手機上對隱私設置做出更好的決策。其次,因爲智能手機的功能有限,分析Crowdsourcing數據和生成建議的過程應該在服務器上完成。以下圖所示:
服務器端有兩個關鍵組件:
一、對手機到的數據進行預處理,好比驗證和分類;
二、針對不一樣用戶的各類移動應用程序的建議。
2.1 基本思想
傳統的推薦系統旨在向一些電子商務市場的客戶推薦具備吸引力和感興趣的商品。所以,每一個用戶對應一個客戶,而且每一個隱私設置被映射到一種商品。
Collaborative filtering算法兩個主要類別:memory-based and model-based方法。「基於用戶」和「基於事項」是memory-based方法的兩種關鍵算法。memory-based算法有如下幾種優點:
一、非參數化方法,較少依賴於假定的模型;
二、很容易被推廣到更高的維度,容易計算和理解;
三、用戶和項目數量上都更加健壯;
四、要求參數數量少,而且計算速度快。
2.2 Item- and user-based collaborative filtering
咱們假設有k個用戶,每一個用戶都有m個應用程序。每一個應用程序都有n個數據訪問權限。定義ri,a,g做爲用戶i設置的設置的應用程序a的數據權限g。二分變量{0,1},whereri,a,g=0(表示用戶不喜歡與任何人分享數據);whereri,a,g=1(表示參與者容許公開信息)
Example 1:兩個用戶,i和j,都安裝了兩個應用a,b,每一個應用都有兩個權限g,h。用戶i和j都容許應用a經過設置ri,a,g=1&ri,a,h=1和rj,a,g=1&rj,a,h=1來獲取數據權限。在這種狀況下,咱們認爲他們可能有相似的隱私偏好。若是用戶i設置ri,a,g=0來組織應用程序b的訪問權限g,用戶j在這個設置上可能會有相同的選擇。
Example 2:應用a’和b’,都安裝在由用戶i’和用戶j’攜帶的智能手機上。應用a’和b’分別持有權限g’和h’。若是用戶i’和j’都拒絕數據訪問,即設置ri’,a’,g’=0&ri’,b’,h’=0和rj’,a’,g’=0&rj’,a’,h’=0。咱們就認爲這兩個項目具備類似性。
咱們定義su(i,j)做爲用戶i和j的類似度,基於皮爾森相關係數計算su(i,j)。可能的類似性值在-1和+1之間,值接近+1表示強烈的類似性。PriWe根據用戶基本信息將用戶爲不一樣的組。
咱們經過應用閾值或top-N策略獲得類似用戶集:
一樣,咱們定義si(g,h)做爲隱私權限g和h的類似度。咱們採用了類似度的餘弦類似度來計算用戶的平均設置行爲的差別。
2.3 probabilistic-based similarity fusion框架
基本思想:基於概略爲兩個類似度su(i,j)、si(g,h)提供不一樣的權重,相應地結合。
爲了下降影響,經過刪除平均值將收集的結果標準化:
咱們定義了一個關於隱私設置的空間樣本。在咱們的案例中實際上有3項,。表示未知的隱私設置;0意味着用戶關注信息是私有的;1表示用戶容許信息的披露。定義做爲用戶x在應用y的許可z上做出決定的條件機率。
咱們能夠根據集合中規範化的隱私設置獲得條件機率:
咱們引入了兩個獨立二元指示器I1和I2表示集US和IS的依賴關係。I1=1表示對集US依賴。I2=0表示獨立性。
使用歐氏距離產生類似函數:
結合上面的條件機率估計獲得結果:
where
3.1 PriWe App
兩個主要目標:一、提供一些用戶設置或更改權限設置相關隱私的輸入組件;二、接收服務器生成的推薦,在用戶確認的基礎上可以自動進行推薦設置。用戶能夠瀏覽安裝的應用及授予的權限。咱們總結了11種濫用數據安卓應用的權限而且討論了它們的風險。
PriWe應用程序須要root權限,或者做爲系統級進程運行。不建議用戶root他們的智能手機。
3.2 PriWe Server
服務器設計用來分析收集到的數據而且相應的生成推薦。服務器有三個關鍵的組件,數據預處理、推薦生成、展現和強化。
4 評估
推薦算法的準確行(有效性),Rp表示實驗過程當中參與者全部的隱私設置,Ri表明了PriWe提供的相應的隱私權限設置的建議。
結果代表,基於問卷調查A和B的結果比基於問卷調查A或B的結果更好。這代表當數據集由更多的crowdsourced權限設置組成時,這些建議能夠達到更高的準確率。兩項調查的結合也能在必定程度上克服數據稀疏問題。
結果顯示特徵:一、由PriWe提供給男性參與者的準確度比女性要高一些;二、隨着參與者年齡的增加,精準度會逐漸提升;三、對於有信息技術背景的參與者來講,對參與者的建議的準確性要高於全部被選中的參與者。
5. 心得
PriWe系統旨在理解用戶對隱私的指望,並對其安裝的移動應用的隱私設置提出建議,以知足用戶的隱私指望,並可以被用戶接受,從而幫助他們在智能手機應用程序中減輕隱私泄漏。在這個信息化時代,智能手機中存儲着大量我的信息和敏感信息,所以,隱私保護就顯得尤其重要,咱們平常在使用智能手機的過程當中都會遇到我的隱私泄漏的困擾,本篇論文針對這個問題提出來瞭解決方案。