Google在今天向幾個國家的數據保護機構提交的用在Google基於位置的服務(LBS)中的基於汽車採集的wifi數據集的副本數據庫
概述服務器
Google的基於位置的服務依賴於各類信號來嘗試爲用戶提供一個近似的位置信息。網絡
這些信號數據包括GPS,以及手機信號塔位置和wifi訪問點位置。ide
Google 經過各類方式來收集手機信號塔的wifi訪問點的位置信息。包括使用有手持設備和計算機應用程序提供的信息,以及汽車上安置的無線電接收器提供的信息。工具
Google定位服務會使用不少媒介來收集wifi訪問點信息給Street View(街景)服務使用,Google爲了減小重複使用這些媒介作了很多工做。然而Google定位服務對於Street View服務來講是一個相對獨立的產品,它和Street View之間的聯繫僅僅是共同使用了物理媒介和設備收集的數據。網站
關於wifi訪問點信息的收集是被動的,僅僅在這些數據在wifi無線網絡中公開發布後纔會收集到。這些數據對任何擁有一個wifi接收器——包括其餘擁有相似筆記本電腦和智能手機等可啓用wifi的設備的人都是可見的。編碼
上面說的數據被Google手機在一個彙集體中,而不是綁定在任何特殊用戶上。這些聚合體中數據用來提升基於位置的服務的品質,而不是直接分享給用戶們。返回給用戶基於位置的服務的信息的應用程序僅僅接受獨立於用戶請求的地理編碼信息,他們不接收關於訪問點額外的信息。加密
訪問點操做器可能會對它們廣播的數據進行我的化(好比改變默認SSID至一個完整名字),這樣作的話它們能夠選擇去把這些數據廣播給公共區域內任意具備wifi功能的設備。無論怎麼樣Google都不會在其基於位置的服務中公開這些SSID(服務集標識符service set identifier)。spa
Google基於位置的服務相關的數據接口
Google經過公開免費的地理位置API(應用程序接口)向不少使用它的產品或者其餘產品的經營商和用戶提供基於位置的服務。
基於位置的服務依賴於各類和用戶設備相關的位置指示器來幫忙識別用戶設備位置。好比帶有GPS(全球衛星定位系統)的設備可以提供一個來自衛星的高精度的地理位置編碼信息。但是,許多設備沒有GPS功能或者在一個收發GPS信號須要很長時間的環境中使用,更有可能在一個沒有GPS信號的環境中(好比在室內,設備沒法接收到衛星信息)。所以其餘的位置指示器也常常用於幫助用戶來定位他們的設備,儘管他們可能沒有像GPS那樣高的精確程度。這些指示器包含與手機信號塔的臨近程度和與wifi訪問點的臨近程度。
爲了可以使用這些位置指示器,Google收集信息來建立了一個數據庫,這個數據庫包含了了已知的手機信號塔和wifi訪問點。這些信息是經過各類手段收集的,包括使用有手持設備和計算機應用程序提供的信息,以及無線電接收器提供的信息。Google並非惟一收集這些數據的公司,許多世界範圍的公司也在一樣的事情,好比Skyhook公司已經在世界上許多地方收集了相似的數據,甚至僅在德國國內就有許多公司參與到了一樣相似的工程,好比Gammax System GmbH,Magic Map,1T2media 和 Frauhfer Institute等項目。
做爲Google公司的部分努力成果,它支持了一個國際化的項目,這個項目使用基於交通工具的無線Wifi接收器來收集有車輛行駛的區域的Wifi訪問點信息。
具備實際意義的是,Google經過適用於一樣的媒介上的設備來收集數據,這些設備收集的是用在像Google Maps(Google地圖)相似產品上的Street View(街景)畫像和三維激光數據。這些僅僅聯繫在基於位置的服務與Street View類產品的數據是被公用於實際和商業目的的。
咱們收集的wifi訪問點信息是衆所周知的,事實上在Wikipedia(維基百科)有記錄,它也在New York Times(紐約時報)上的幾篇文章中談到過。咱們一樣也提供了關於咱們基於位置的服務和位置指示器的豐富信息,這些都能在咱們各類各樣的博客上看到的。好比說My Location feature on Maps for mobie, My Location on the desktop, Gears geolocation API等文章。
這門技術是怎麼運做的呢?
顯而易見的是每一個車輛的車頂上都附加了商用的Maxrad BMMG24005全向天線。這些天線接收車輛能收到的範圍內的公開廣播無線wifi信號。
這些車輛以一個正常的速度行駛,所以僅僅花費少許時間在能收到信號的範圍內和wifi訪問點進行通信。
這些信號在車輛裝載的計算機中用相關軟件進行初始化處理,這些軟件包括使標準的kismet開源應用程序。這些數據會在轉移到Google數據中心後進一步被處理,而後被用來編譯成Google的基於位置的服務的數據庫的數據項。
那些裝備在車輛上的設備是被動運轉的,接收廣播的信號,但不主動尋找和對訪問點進行通訊。
這些對車載設備可見的信號是經過無線電網絡公開廣播的,它們參照802.11信號標準編碼。這個信號標準包含802.11b/g/n協議。
這些車載設備可以接收任意廣播幀中的數據。它們包括來自頭文件的、SIID和MAC(Media Access Control 介質訪問控制)地址。可是,全部來自數據幀的負載數據會被捨棄,因此Google歷來不收集任何通信的內容。另外,此外,訪問節點的運營商能夠選擇具備限制的SSID廣播,也就是說在許多狀況下這意味着這些SSID不會被搜索到(儘管這會隨訪問接入點的方式而發生改變)。
上述的車載設備一樣也能獨立記錄廣播的下信號長度和頻道,這些廣播可以被咱們的設備搜索到且使用可創建的通信協議(802.11b/g/n協議)。
若是一個接入口是加密的,那麼我就可能從收到數據中辨識出它來,這些辨識信息可能包含在幀頭中,但在任何狀況下幀內存在加密將是不言而喻的。
咱們怎樣使用wifi接入口數據
咱們所收集的數據是用來提供給使用基於位置的服務的產品和使用地理編碼API的用戶們的。好比使用Google Maps的智能手機用戶能夠打開「My location(個人位置)」來找到本身的近似的位置。這些位置數據信息是根據手機信號塔和wifi接入口來肯定的,這些接入口對設備來講是可見的。一樣的道理,像Twitter這類網站用戶可以使用基於位置的服務來增長地理編碼位置信息到他們的消息中,從而來得到更好的聊天上下文。
Google如今正使用兩份數據從駕駛操做中得到數據來創建對應的信息數據庫和提供基於位置的服務,這兩份數據分別是wifi接入口MAC地址信息和能夠得到的汽車實時GPS座標。
這些數據被存儲在一個彙集表中,被用來提供基於位置的服務。
Google的基於位置的服務像下面同樣使用使用wifi接入口數據:
●用戶設備向Google位置服務器發送一條請求,這個請求包含設備當前可知的接入口MAC地址列表
●位置服務器將這些用戶設備上傳的MAC地址列表和已知的MAC地址列表進行對比,而後辨別出相關聯的地理編碼位置信息(例如經度和緯度)。
●位置服務器使用這些地理編碼的位置信息和可見的MAC地址以計算出近似的位置信息
●這個近似且被地理編碼的位置信息會被返回給用戶的設備
Google惟一公開的數據是的地理編碼表,這能夠用來將上傳MAC地址和一直MAC地址對比得出近似的用戶位置信息。在任什麼時候刻,Google都不會公開用戶上傳到數據庫的 MAC地址信息(和一些德國和其餘地方的位置信息提供者不一樣)。
有人推測Google會製做一個開放的地圖,這個地圖上有着各個wifi接入口的對應地理信息等,包括辨識到的開放的wifi接入口的SSID。但這個Google是不會提供這樣的服務的。
原文:Raphael Leiteritz,產品經理,Google,27/04/2010