百度、高德地圖數據源是哪裏?

轉自 EdwardSun

 

 

要說數據來源,首先得對地圖數據作一個分類,由於不一樣分類的數據,其來源,採集方法都是有大不一樣的。

要明白地圖的數據分類,必須先理解一個概念,就是地圖圖層的概念:算法

       如上圖,電子地圖對咱們實際空間的表達,事實上是經過不一樣的圖層去描述,而後經過圖層疊加顯示來進行表達的過程。服務器

對於咱們地圖應用目標的不一樣,疊加的圖層也是不一樣的,用以展現咱們針對目標所須要信息內容。網絡

其次呢,我引入一下矢量模型和柵格模型的概念,GIS(電子地圖)採用兩種不一樣的數學模型來對現實世界進行模擬:併發

矢量模型:同多X,Y(或者X,Y,Z)座標,把天然界的地物經過點,線,面的方式進行表達工具

 

柵格模型(瓦片模型):用方格來模擬實體post

 

目前在互聯網公開服務中,或者絕大多數手機APP裏看到的,都是基於柵格(瓦片)模型的地圖服務,好比你們看到的百度地圖或者谷歌地圖,其實對於某一塊地方的描述,都是經過10多層乃是20多層不一樣分辨率的圖片所組成,當用戶進行縮放時,根據縮放的級數,選擇不一樣分辨率的瓦片圖拼接成一幅完整的地圖(因爲通常公開服務,瓦片圖都是從服務器上下載的,當網速慢的時候,用戶其實可以親眼看到這種不一樣分辨率圖片的切換和拼接的過程)字體

對於矢量模型的電子地圖來講,因爲全部的數據以矢量的方式存放管理,事實上圖層是一個比較淡薄的概念,由於任何地圖元素和數據均可以根據須要自由分類組成,或者劃分紅不一樣的圖層。各類圖層之間關係能夠很複雜,例如能夠將全部的道路數據作成一個圖層,也能夠將主幹道作成一個圖層,支路作成另一個圖層。圖層中數據歸類和組合比較自由。網站

而對於柵格模型(瓦片圖)來看,圖層的概念就很重要的,因爲圖層是生成製做出來,每一個圖層內包含的元素相對是固化的,所以要引入一個底圖的概念。也就是說,這是一個包含了最基本,最經常使用的地圖數據元素的圖層,例如:道路,河流,橋樑,綠地,甚至有些底圖會包含建築物或者其餘地物的輪廓。在底圖的基礎上,能夠疊加各類咱們須要的圖層,以知足應用的須要,例如:道路堵車情況的圖層,衛星圖,POI圖層等等。google

底圖一般是經過選取必要地圖矢量數據項,而後經過地圖美工的工做,設定顏色,字體,顯示方式,顯示規則等等,而後渲染獲得了(一般會渲染出一整套不一樣分辨率的瓦片地圖)3d

固然,即使在瓦片圖的服務中,在瓦片底圖之上,依然可以覆蓋一些簡單的矢量圖層,例如道路走向(導航和線路規劃必用),POI點圖層(找個飯館加油站之類的)。只不過瓦片引擎沒法對全部地圖數據構建在同一個空間數據引擎之中,比較難以進行復雜的地圖分析和地圖處理。

那麼既然瓦片圖引擎有那麼多的限制和缺陷,爲何不都直接使用矢量引擎呢?由於瓦片圖引擎有着重大的優點:

1. 可以負載起大規模併發用戶,矢量引擎要耗費大量的服務器運算資源(由於有完整的空間數據引擎),哪怕只是幾十上百的併發用戶,都須要極其誇張的服務器運算能力了。矢量引擎是沒法知足公衆互聯網服務的要求的。
2. 因爲地圖美工介入的渲染工做,瓦片圖能夠作得很是好看漂亮和易讀,比較適合普通用戶的瀏覽

附:一張矢量地圖截圖:

 

 

其實主要就是爲了引入圖層和底圖的概念,以方便說明下面的地圖數據分類

 

爲了說明數據的來源和採集渠道,採集方法,將地圖數據分爲如下幾個類型:

 

     1. 底圖數據: 其實就是地圖中最基本的地物外形數據及必定的相關附加信息(例如道路名,河流名等)。事實上隨着遙感和航拍衛拍技術的進步,這部分數據依賴實地採集的比例已經愈來愈小,商業地圖數據商,尤爲以高德爲表明,處於成本收益考量,基本已經不多采用實地採集的方式了。這部分的數據主要來源於3種:

官方地圖:嚴格來講,這不能說是一種單獨的渠道,由於官方地圖的數據自己,也是來源於下面的兩種渠道,可是官方地圖通常來源於政府相關部門的權威測繪和發佈,所以也單算成一種渠道。固然,須要說明的是,地圖廠商能從國家權威部門拿到或者買到的地圖,要比咱們平常在街上商店裏買到的地圖要精細豐富不少,固然,不少時候也是用電子格式提供的。
固然,不管任何國家,真正高精度的地圖(例如1:200比例或更高)是受限制不會對外公佈的。(相對應給你們參照的是,我國規定互聯網上能夠公開發布的地圖,最高精度是1:10000)

 

      實地外採:說白就是測繪人員利用專業的儀器儀表,在實地環境中測繪所獲得的。這樣的採集方法耗時耗人都很是厲害,一則成本高,二則週期長,三則是採環境要求高(去喜馬拉雅山去測測能弄吐血了),並且未必可以徹底跟得上中國如今的城市變化。可是優勢在於精度高,置信度,準確度很是高。這是國家測繪部門主要採用的手段,對於像北京市這樣一個城市來講,通常幾年纔會完整從新測繪一輪。通常對於大多數商用測繪時,只是用在少數局部須要時,重點測繪才用獲得。

 

                             這個你們馬路上應該也偶爾能見到

 

固然,在精度和準確度要求沒有那麼高的地方,實地採集也可使用一些成本更低更便捷的工具,而不是專業測繪設備。例如用攜帶高精度GPS或其餘定位的手持智能設備步行以繪製輪廓等。

航片衛片製做:就是經過本身拍攝或者購買的高精度航空照片或者衛星照片或者遙感照片,在此做爲底片的基礎上進行人爲的矢量標註和勾勒,從而造成本身的矢量數據。如今的航片或者遙感片的精度已經能夠很高了,通常來講作到分辨率(原文說的是精度)在0.05米的程度已經很容易。高德本身的航片聽說已經能夠作到0.03米的分辨率(原文說的是精度),對於商用地圖數據來講,一般已經夠用了。即使做爲國家權威測繪,在大量荒郊野嶺的測繪,也主要依賴於這種手段。
目前經常使用的航拍或者衛拍手段包括機載數碼攝像,機載遙感以及三維激光掃描(主要用於3D地圖數據採集)

 

                                         0.05米分辨率(原文說的是精度)航片 

                                             衛片路網標註

 

 

航片/衛片標註和勾勒,前面是在底片上的操做,後面是勾勒標註後獲得的矢量圖

 

 數據加工製做示意圖(來源於高德某公開資料)

從這部分數據來講,百度是沒有本身的採集生產能力的,也沒有執照(沒有測繪資質)。百度的這一塊數據主要是向四維圖新買的。

國內這一塊的數據,主要有兩家供應商,就是高德和四維圖新。

四維圖新和國家測繪單位的關係非比尋常,其數據依賴國家測繪單位供給的佔大頭(固然也有互相供給的)。

高德也有一部分數據來源於國家測繪單位的供給,可是高德本身的航拍製做的能力仍是不錯的(還承擔過一些國家測繪機關的測繪任務),相對來講,依賴國家測繪單位數據的比例要低一些。

總的來講,這部分數據的採集生產,在中國須要國家認定的資質,有資質的除了國家測繪機關之外,商業機構原本就不太多,而真正在這個數據供給市場上活躍的,如今主要就是高德和四維圖新這兩家。

其餘不管是谷歌地圖也好,蘋果地圖也好,這部分的數據,基本上都是從上述兩家購買的。

2. POI數據:嚴格來講屬於矢量數據,不過是最簡單的矢量數據,換句話來講就是座標點標註數據。也是電子地圖上最經常使用的數據圖層。

咱們平常在電子地圖上所使用的數據都是POI數據(就是地圖上常見的那種標個氣球的點)。

POI數據只是信息關聯座標點的數據,不涉及到線和麪,是最簡單的矢量數據,用於簡單的地點標註而不須要相應地物輪廓的需求。

POI數據的內容五花八門,通常POI數據的供應商提供的POI數據都是平常經常使用的場所數據,例如飯店,商店,加油站,銀行等平常經常使用設施。

固然,在一些特殊的地圖應用領域,也能夠委託這些數據供應商或者自行去專門採集特殊用途的POI數據,例如井蓋,消防栓等

 

稅務GIS系統標註企業及納稅信息

值得指出的是,POI數據的編輯更新簡單,同時也常常用於動態數據標註,最經典的莫過於車輛定位標註。

POI數據的採集和生產來源五花八門,不能盡述,總的來講,主要有如下幾種:

a)經過整合GPS的攝像機,步行或者車行,進行掃街持續拍攝,回去之後,再根據拍攝結果手工進行輸入和標註,這種方式適合於大規模的進行採集標註,效率高,成本低,車行居多,尤爲適合沿街的店面和場所的採集和標註,是目前數據採集供應商的主要採集手段之一

b)經過專職或者兼職人員,使用手持含GPS的智能設備(好比智能手機),進行拍攝(主要是爲了取證),輸入,提交,進行採集。這種採集方式,大多用於上述方法a的補充。在一些車輛不能達到的地方,或者商戶設施變更頻繁的某些區域使用

c)地址反向編譯:經過門牌地址號碼,以及矢量地圖中的道路數據,運用算法進行定位標註。這種標註精度相對最低,準確性也不高,可是成本很是低。用在不須要特別高精度,成本控制也比較嚴的採集領域。你們在地圖服務搜索框中輸入地址門牌號,能夠直接出現標註點,用的就是這個技術。

d)互聯網或者企業獲取:直接從一些專業類服務網站上抓取或者購買(例如大衆點評,攜程),或者直接從你們在其公開的地圖服務上的標註中進行篩選和獲取。這就是google,百度,高德本身免費向社會開放其地圖服務所可以得到的利益。尤爲對於開放API免費企業客戶的使用,這種獲取是頗有價值的。

國內POI數據的供應商沒有太多資質限制,相對底圖數據供應商,要多不少,例如圖吧等都是POI數據供應商,固然四維圖新和高德也提供POI數據,每一個POI數據供應商,都有其本身的分類方式,數據定義等內容。不少時候,你們也互相買來買去,互補有無。

百度地圖這方面的數據,主要來自四維圖新和道道通,固然也有其餘來源,甚至有少許的自產數據。

高德地圖這方面的數據以自產爲主,輔以向一些專業服務商購買(口碑網,大衆點評,攜程,樂途,搜房)

3. 其餘數據圖層或數據:常見的有衛圖圖層,交通情況圖層,三維圖,街景圖。專業一些的領域有樓盤圖,室內圖,氣溫分佈圖,商圈分佈圖,地形圖,水文圖等等。

 

微觀地圖

 

 

樓盤市佔圖

 

地質災害圖

 

電視有限網絡分佈管理圖

 

人口密度圖

 

人口密度圖

 

三維實景地圖

 

三維數據示意圖

 

之因此貼這麼多五花八門的圖,主要就是爲了說明,基於電子地圖的數據圖層真的是應用範圍和應用領域極廣,不一樣的圖層,表明了不一樣的數據,這個領域有大量專業性的應用和數據,其採集方法,來源渠道也五花八門,難以盡述。

簡單說幾種經常使用數據的來源:

a)交通擁堵數據:這個通常來源於專業的數據供應商,這些供應商和交通部門有較深合做,其數據採集主要依賴於在出租車上安裝的GPS來採集實時車速爲主,或者經過攝像頭,紅外探頭,雷達測速測量車速爲輔

b)三維數據:主要依賴激光掃描以及手工建模處理等

c)假三維數據(那種不能旋轉的45度三維俯視圖):依賴照片拍攝和材質帖紋手工製做。

d)街景:依賴實採拍攝

百度地圖基本上只有最基本常有的一些圖層數據,例如部分三維數據,交通圖層數據,衛片圖層數據等,百度不具有這部分數據的採集和生產能力,都是向不一樣供應商外購的。

高德地圖有一些專用數據,例如樓盤數據等,高德在一些數據領域有采集和生產能力(例如三維數據等),能夠根據客戶的要求進行專業採集生產過程,提供專業的圖層數據。

不過一些特別偏,特別專業的數據領域(就像上面有的有電視網,地址災害圖)就須要應用者本身經過專業的工具進行製做了

有不少特種數據圖層是不能在瓦片圖引擎上顯示,或者在瓦片圖引擎上顯示是沒有任何意義的。

只存在於矢量引擎的應用。

總結:

百度的地圖數據主要靠買,高德地圖數據以本身採集生產爲主。

就國內的狀況來看,主要的數據都依賴於採集。這點和國外發達國家有比較大的差異。在國外發達國家,因爲建設速度相對比較緩慢,政府的信息化水平以及信息透明作得較好,其實不須要那麼多采集工做。

這個行業內有句話,叫作國外(發達國家)之內勤爲主,外勤爲輔,國內之外勤爲主,內勤爲輔。

因爲地物變化相對比較緩慢,政府公開和發佈的數據比較及時,透明,準確,可用,所以國外這個行業許多數據生產商直接拿政府公佈數據作一下加工就能夠了,改動的地方也很少,國內還比較依賴數據生產上本身採集。(舉個例子,這裏面比較典型極致的是日本,哪裏新安裝了一個紅綠燈都會在政府網站上及時準確公佈,並標註位置,更不用說樓盤建設,城市建設等大動做了,所以數據生產商拿這些數據來就能夠直接用,不多須要本身去採集了)

相關文章
相關標籤/搜索