高德在提高定位精度方面的探索和實踐

時間 2019-11-05

原文原文鏈接

2019杭州雲棲大會上，高德地圖技術團隊向與會者分享了包括視覺與機器智能、路線規劃、場景化/精細化定位時空數據應用、億級流量架構演進等多個出行技術領域的熱門話題。現場火爆，聽衆反響強烈。咱們把其中的優秀演講內容整理成文並陸續發佈出來，本文爲其中一篇。算法

阿里巴巴高級地圖技術專家方興在高德技術專場作了題爲向場景化、精細化演進的定位技術的演講，主要分享了高德在提高定位精度方面的探索和實踐，本文根據現場內容整理而成（在不影響原意的狀況下對文字略做編輯），更多定位技術的實現細節請關注後續系列文章。數據庫

如下爲方興演講內容的簡版實錄：網絡

今天要分享的主題是關於定位的場景化、精細化。高德定位，並不僅是服務於高德地圖自己，而是面向全部的應用開發者和手機設備廠商提供定位服務。目前已有30萬以上的APP在使用高德的定位服務。

用戶天天會大量使用定位服務，好比看新聞、打車、訂外賣，甚至是購物，首先都是要得到位置信息，有了更精準的位置信息，纔可能得到更好的服務體驗。架構

高德地圖有超過1億的日活用戶，可是使用定位的有好幾個億，天天的定位請求數量有一千億次。如此大的數據量，高德定位服務能夠保持毫秒級的響應速度，咱們在這裏面作了不少工做。此外，咱們還提供全場景的定位能力，無論爲手機、車機仍是任何廠家，都能提供位置服務。機器學習

我今天從四個方面介紹，分別是：學習

定位面臨的挑戰大數據
高德地圖全場景定位優化
分場景提高定位精度編碼
將來機遇3d

定位面臨的挑戰

你們可能都知道GPS，GPS在大部分狀況下能夠提供很好的精度，可是對於某些場景仍是不夠，好比駕車，GPS給出的精度大概是10米，若是僅靠GPS定位甚至沒法區分出在馬路的哪一側。

第二個場景是在室內，室內收不到GPS信號，這樣的場景下如何實現比較準確的定位？第三個場景是如何在精度和成本之間取得平衡，由於不可能爲了追求一個很好的精度去無限投入成本。只有經過海量大數據挖掘，算法和數據質量的提高，達到效果的持續優化，才能達到最終對各類場景的全覆蓋。

有不少技術能夠選擇，除了GPS定位，還有基於網絡定位、Wifi基站，原理就是經過掃描到的Wifi和基站列表、信號強度，進行數據庫查找，找到Wifi位置，定位。

除此以外還有慣性導航定位，慣性導航是一種相對定位的方式，能夠不斷計算跟上次定位的偏移量，有了初始定位以後，根據連續計算能夠得到最終的位置。

還有根據地圖匹配定位，好比GPS的點落在一個湖裏，顯然是有問題的，能夠經過地圖匹配，找到最近的一條路，這時候精度就獲得了提高。

還有一些定位方式最近幾年變得很熱門，例如視覺、雷達、激光，自動駕駛的概念推進了這些技術的發展，這些方式各有各的定位精度和差別性。例如視覺，在實踐中每每須要大量計算和存儲的開銷。

不少時候，仍是要基於Wifi的定位，得到初始定位，而後在不一樣場景下不斷的優化，經過不一樣的數據源提高精度。

高德地圖如何實現全場景定位

高德主要分爲兩個業務場景，手機和車機。在手機上主要是GPS+網絡定位。駕車的場景下，咱們還會作一些根據地圖的匹配，實現對特殊道路的支持。

以往，不少用戶會反饋說會遇到GPS信號很差，致使沒法定位、沒法導航的情形。約有60%的狀況是由於用戶位於地下停車場或者在隧道里，約30%的狀況是附近有嚴重的遮擋，好比在高架橋下，或者在很高的高樓旁。這些都會形成對GPS比較嚴重的遮擋。

咱們打電話的時候，鏈接的基站可能就在一千米範圍內，這樣短的距離傳輸信號還時常會出現信號中斷，若是GPS信號距離兩萬多米的高度，出現問題的可能性仍是存在的。因此必須經過其餘方式，例如地圖匹配或者慣性導航來對GPS進行補充。

在室內的場景，須要解決的是如何去挖掘Wifi基站的位置，提高精度。

在車機的場景，咱們會結合更多來自於汽車的數據輸入來幫助咱們。

定位的基礎能力

網絡定位本質上是一個數據閉環，每一個人在定位的時候，其實是發送了自己的基站和Wifi列表，發送的數據一方面能夠用來定位，另外一方面也能夠用作數據訓練。數據訓練主要產出兩種數據，一個是Wifi基站的位置，經過數據挖掘，咱們就能夠得到大概的位置（初始定位），可是精度比較差。第二個是產生更詳細的空間信號強度分佈圖。有了這個圖之後，就能夠進行比較精準的定位了，根據信號強度判斷我距離這個基站和Wifi有多遠，從而對精度進行改進。

數據閉環完成之後，就是一個正向的反饋，數據越多，訓練結果越多，定位結果就越準確，從而吸引更多的用戶來使用（產生數據）。這就是經過數據挖掘，不斷提高精度的閉環。

算法部分，咱們也通過了不斷的迭代。最先是基於經典的聚類模型，就是掃描基站Wifi列表，聚類之後選擇其中一處做爲個人位置，這個方法效率比較高，很快能夠獲得結果，可是精度不好。

第二步，咱們把空間進行了精細的劃分，在每一個網格內統計一些基礎的特徵，好比歷史上的點定位的數量、定位的次數、Wifi的數量等等，計算出一個網格的打分，再對網格進行排序，最後你的定位點就是這個網格。經過這種方法，30米精度的佔比提高了15%。

這種方法也有侷限性，人工調參帶來的收益是有限的，調到必定程度就沒辦法再提高了。因此，第三步就是把機器學習算法引入這個過程，利用監督的學習提高到最佳的模型和參數，這樣能夠在特定場景下得到顯著提高。主要的場景就是解決大偏差的Case。

一個比較典型的問題就是，掃描到的基站Wifi可能只有一個基站、一個Wifi，沒有別的信息了。這個基站Wifi又離的特別遠，不管選擇基站仍是Wifi，都有50%的機率是算錯了。有監督學習，就能夠把海量的配送拿出來，精細化的挖掘細微的差別，達到全局最優的效果，在某一狀況下選基站，某一狀況下選Wifi。把犯錯的比例下降了50%。

上圖就是咱們的線上神經網絡的模型，神經網絡用於在線服務如今是比較流行的方式，咱們在這裏其實是利用基站和Wifi的信號強度和混合特徵做爲特徵輸入，同時把歷史位置也做爲序列放進來，這個歷史位置特徵會放入一個RNN模型，預測如今的位置，使用預測的結果和基站Wifi列表特徵，再往下預測，最後是網格的打分。最終輸出一個機率最高的網格做爲輸出。

這個方法最大的挑戰並非在算法，而是算法效果和工程上的可實現性，如何可以達到最優。高德天天有上千億次的調用，延時要在10毫秒之內。

另外，數據量很大，全部的數據，每條都有不少特徵，在線的數據存儲大概有幾十個TB，這個數據量也不可能放在在線服務裏作，因此要作相應的優化。

咱們作了三個方面的優化，第一是分級排序。把定位過程變成一個顯微鏡步驟，先作一個很粗略的定位，而後逐步收斂到很精確的位置。粗略定位的時候能夠用很大的網格，用不多的特徵，快速過濾掉一些不可能的位置。

而後，在很精細的網格里，用更多的特徵、更多的網格進行排序。經過這種方法，就能夠極大提高計算的效率，把一些沒必要要的計算過濾掉。

第二是模型簡化。雖然深度學習的效果很好，可是不可能在線上用很複雜的模型，咱們經過減小層數和節點數，把浮點數精度下降。

第三是特徵壓縮。這裏面有特點的一點是咱們根據模型進行的壓縮，原始特徵的輸入的數量是很大的，咱們增長一個編碼層，輸入的特徵通過編碼層之後，只輸出兩個字節的特徵。咱們把在線、離線的數據處理好之後，最後在線只存儲兩個字節。經過這種方法，在線特徵的數據量下降了10倍，下降到1個TB之內。以上是解決的幾個主要問題。

不一樣場景下的精度提高

在室內場景，常常會定位到室外去，這跟剛纔介紹的序列流程是有關係的，由於採集過程更大機率是在室外，序列後的Wifi位置都在馬路上，因此定位最後的機率也是在馬路上，可是這對用戶體驗是不好的。好比打車，可能在室內叫車，定位在對面的馬路上，但這條馬路多是不對的，須要找到我在哪一個樓裏，離哪一個道路比較近。

怎麼解決這個問題？一種方法是經過數據採集，就是在室內進行人工的採集，使訓練數據的數據分佈跟實際的預測數據分佈保持一致，這種方法固然精度比較好，可是主要缺陷是成本很是高，目前也只是在熱門商場和交通樞紐進行這樣的數據採集，這確定不是一個可擴展的方法。

咱們的方法是想經過引入更多的數據優化定位過程。若是能基於地圖數據挖掘出Wifi和POI的關係，就能夠用數據關聯提高精度。好比掃到一個Wifi，名字叫KFC，有一個可能就是你在肯德基裏，這個方法比較簡單。實際用的方法會更加複雜。

咱們是利用Wifi信號的分佈反向挖掘出位置，上圖裏藍色的部分就是樓塊的位置，紅色的點是Wifi的真實位置，綠色的點是採集到Wifi的位置，綠色越亮，表明這個地方的信號強度越強，經過這個圖放入圖像學習，好比用CNN挖掘出它的位置之後，咱們就能夠創建一個Wifi跟樓塊或者跟POI的關聯，經過這個方法可使全量Wifi的30%都能關聯上相應的POI或者樓塊。

在線的時候須要知道用戶何時在室內，何時在室外。咱們用的是利用信號強度特徵作區分的算法，在室內室外掃描到的Wifi列表和強度會有很大差異，經過這個差異能夠訓練出模型。綠色的點預測爲室內的點，藍色的點是室外的點。經過這種方法，定位精度提高了15%。

駕車場景，導航過程當中可能會遇到的常見問題。第一個問題是沒法定位，開到停車場或者有遮擋的地方，第二個場景是點會有漂移，由於GPS受到建築或者其餘遮擋的時候，會產生精度降低的狀況。第三種狀況是沒法區分主路，可能會錯過路口。

對於以上問題，咱們採用的是「軟+硬」融合定位，軟的部分包括兩部分，一個是基於移動定位，第二個是根據地圖匹配。通過兩個「軟+硬」結合以後，咱們在GPS 10米精度作到90%以上，能夠實現高架主路和停車場的持續導航。

這裏面關鍵的就是如何實現融合定位，比較有特點的一點就是咱們作車機的傳感器模塊是低成本的，成本不到100元，其餘相似產品成本是比較高的，可能須要幾千塊錢。使用低成本的器件，可以更容易獲得普及。缺點是精度比較差，定位準確性差一些。要經過軟件的方法彌補硬件上的缺點。

咱們的解決辦法分紅三個步驟，首先是航向融合。陀螺儀有相對的角度能夠算出來，加速器能夠算出地球引力的方向，這兩個結合之後就能夠創建一個濾波方程，把真實的方向持續不斷的輸出。第二，把三維的方向和GPS的結果進行一次融合，就能夠計算出修正後的位置。第三步，再和地圖匹配作對比，由於咱們知道它的方向、位置之後，就知道它是在上坡仍是下坡，是在高架上仍是高架下。還有一點，匹配後的位置跟GPS原始位置作對比，若是差異很大，GPS可能發生了偏移，咱們就把GPS捨棄掉，只用慣性導航推算。

這裏面有三個特色，第一，參數動態標定，不須要對器件有初始的標的，咱們經過三維的計算出方向，用地圖匹配反饋。關於地圖匹配的部分，核心是咱們利用HMM的算法進行位置的匹配，推算每一個點的道路。這裏面比較關鍵的機率，一個是發射機率，一個是位置轉移機率。

第二，咱們把角度也考慮進來，角度的變化一樣用於決策轉移機率，這裏面跟位置轉移機率的區別就是引入了速度作變量，不一樣的速度下，發生轉角的機率是不同的，速度慢了可能會轉向，速度快也可能轉向，因此咱們針對每一個速率都有一個曲線。

上圖是定位效果，紅色的點是實際修正後的軌跡，藍色的點是原始的GPS點，下面是在高架下的效果，能夠看到高架下GPS點已經很是發散了，飄的處處都是，可是修正以後跟綠色的點是重疊的。下面的圖是在停車場裏，在停車場進去的時候，藍色的點就已經消失了，可是紅色的點能夠很好的還原出用戶在停車場裏持續的軌跡。

高精定位方面，高德主要創建兩種定位能力，一種是基於圖像定位，一種是基於融合定位。圖像定位是隻用圖像就能夠造成比較好的分米級精度，融合定位主要是引入了兩個新的定位技術，一個是VSLAM，一個是差分GPS。這兩個方法分別應用於有GPS和沒有GPS的狀況，能夠提供很好的精度。VSLAM能夠作到偏差很小，由於能夠有圖像的方法進行修正。

自動駕駛是一個方向，而且須要從輔助駕駛過渡到自動駕駛，但系統性變化到來以前會有階段性的變化，就是服務於人的導航服務的精細化，即車道級導航。車道級導航須要高精地圖，至少是分米級的精度。

對將來定位技術發展的理解。基礎能力部分，咱們認爲5G的出現會爲定位提供一種新的可能性，由於5G的頻率比4G更高，波長會更短。它能夠測距，之前基於基站和Wifi的定位都是基於信號強度的。可是5G支持了測距之後，它就能夠提供一個很好的精度，因此可能會出現一種方式，基於5G的定位能夠達到相似GPS的效果。

第二是融合定位，隨着各類新的數據源不斷出現，用新的算法去發揮不一樣數據源的特色，從而達到總體效果的提高。駕車部分，視覺定位和差分GPS技術的逐漸普及。室內部分，有超寬帶的定位，除此以外還有藍牙和Wifi的精準定位。在最新的技術標準裏，也都支持了測距和測角的技術，也就是將來新的藍牙或者Wifi的APP，可能就能提供一部分的定位能力。

因此，將來10年內，咱們可能會看到這幾種方式相互融合，精度會獲得質的改變。以上就是我介紹的內容，謝謝你們！