機器學習在高德地圖軌跡分類的探索和應用

時間 2020-10-17

原文原文鏈接

1.背景算法

當咱們打開導航，開車駛向目的地的過程當中，有時候會碰到這樣的問題：前方明明沒有路，可能在施工封閉，但是導航仍然讓咱們往前開車，以致於咱們沒法順利到達目的地。全國道路千千萬，天天都有巨量的道路變得不可通行，那麼如何動態的識別出哪些道路走不通了呢？數據庫

圖中所示即爲因封路事件致使的導航路線改變安全

道路不通每每致使該條道路汽車流量忽然下降。監控汽車流量的變化是挖掘封路事件的重要指標。可是，目前業務中遇到的一個重要問題是，針對汽車沒法通行的封路事件，行人、自行車可能均可以穿行，這些行人、自行車等的噪聲流量大大削弱了道路流量變化。網絡

所以，若是可以對行人、自行車、汽車的軌跡進行分類，就能夠對道路流量的噪聲進行過濾，僅僅關注汽車流量，流量隨着封路事件的變化將更爲顯著，從而便於道路封閉的挖掘。本文主要針對非機動車、機動車分類探索軌跡分類問題。運維

2.樣本獲取與標籤制定機器學習

因爲軌跡數據缺乏原始真值，咱們將用戶導航模式做爲軌跡分類的僞標籤。例如當時用戶採用汽車導航，其軌跡對應的標籤即爲汽車。因爲汽車導航數據遠遠多於非機動車，不一樣僞標籤樣本比例差別巨大，存在嚴重的樣本不平衡問題。此外，用戶導航模式與用戶實際出行方式可能並不一致。好比有些用戶能夠根據汽車導航步行到達目的地。下文介紹的標籤-機率混合貝葉斯模型將分析並試圖解決上述2個問題。函數

3.特徵分析學習

能夠將軌跡分類相關特徵劃分爲5類。分別是：優化

軌跡概況特徵集，包括軌跡耗時、軌跡長度、軌跡開始時間等。
速度相關特徵集，包括最大速度、平均速度、速度標準差等。
時間相關特徵集，包括道路末端等待紅燈時間，調頭時間，左轉時間等。
行爲相關特徵集，包括調頭行爲，往復活動，左轉減右轉時間等。
用戶畫像特徵集，包括用戶職業、有車機率。

下面以軌跡開始時間特徵爲例，解釋該特徵的物理意義。其機率密度函數以下所示（drv，汽車；byc，自行車；wlk，步行）：編碼

早晨（5:00~10:00）汽車軌跡機率較高，多是早高峯致使。

午時（11:00~13:00）自行車軌跡機率較高，多是因爲外賣送餐。

傍晚（17:00~20:00）步行、自行車機率均較高，多是因爲下班散步以及外賣送餐。

4.貝葉斯模型的機率分佈視角

選擇基於貝葉斯分類器進行改進的緣由以下：

貝葉斯分類器屬於生成模型，依賴於條件機率密度函數，具備明確的統計學意義。此外，如前面提到的條件機率圖示，經過觀察不一樣軌跡、標籤的機率密度函數，可以逐個分析、說明特徵的有效性。
貝葉斯分類器能夠表示爲:

經過增添、刪減、改動特徵的機率密度函數，能夠快速完成貝葉斯分類器的迭代改進。而且相較於決策樹，貝葉斯分類器不會對某一個特徵的變更過於敏感。
貝葉斯分類器最終輸出爲機率值，能夠做爲置信度。

4.1 標籤-機率混合貝葉斯模型

當前軌跡分類問題爲樣本不平衡（Data Unbalanced）標籤不許確（Noisy Label）問題。

Tanaka等人基於卷積神經網絡提出了僞標籤損失函數，經過交叉熵損失函數與僞標籤損失函數的迭代優化完成了錯誤標籤的修正[2]。受此啓發，貝葉斯模型一樣可以創建僞標籤損失函數完成樣本清洗。

咱們基於貝葉斯分類器的分類結果，提出基於僞標籤極大似然估計的僞標籤損失函數，完成錯誤樣本清洗，再迭代完成貝葉斯分類。該模型的迭代流程以下圖所示。

標籤-機率混合優化貝葉斯模型迭代流程。

4.2 聯合機率密度函數計算

因爲貝葉斯分類器假設各變量相互獨立，所以不可避免的會對一些場景下的樣本產生錯誤預測。例如，外賣騎手以及快遞員應當被斷定爲非機動車。這種類型軌跡長度可能較長（超過10千米），最大速度適中（小於50千米每小時）。在假設行駛距離與最大速兩個特徵相互獨立的狀況下，容易錯誤地把外賣騎手以及快遞員的行駛軌跡斷定爲汽車。

自行車軌跡行駛距離以及最大速度聯合機率密度函數

汽車軌跡行駛距離以及最大速度聯合機率密度函數

可是，行駛距離與最大速兩個維度的特徵並不相互獨立。上圖構建了針對汽車軌跡這兩個維度的聯合機率密度函數，能夠發現，對汽車軌跡而言，行駛距離越長，最大速可能越高，當汽車行駛距離超過10千米時，其最大速度小於50千米每小時的可能性很低。所以，經過構建行駛距離與最大速度兩個維度的聯合機率密度函數，替換兩個獨立機率的相乘，能夠幫助解決長距離非機動車軌跡被誤判爲汽車的問題。

4.3 基於貝葉斯的軌跡分類實驗結果

評測團隊抽樣約100條數據並人工標記真值。最終模型分類效果如表所示。

5.深度學習模型的圖像編碼視角

因爲軌跡數據缺乏原始真值，咱們將用戶導航模式做爲軌跡分類的僞標籤。例如當時用戶採用汽車導航，其軌跡對應的標籤即爲汽車。本次基於深度學習的探索不考慮標籤噪聲的問題。

5.1 軌跡信息的兩種觀察方式

深度學習的優點在於可以從原始數據中學習到有效信息，無需人工挖掘特徵。針對軌跡數據的特色，存在兩種觀察軌跡的方式，分別是時間序列與空間分佈。

時間序列：軌跡當中的GPS點數據隨時間推移依次上傳至數據庫中。軌跡數據自然具有時間序列屬性。所以，能夠採用TCN或RNN構建模型，學習軌跡中的時間序列信息，完成軌跡分類。

空間分佈：將軌跡數據繪製在地圖中，則軌跡構成圖片中的一條線。若是可以將速度、方向、等待時間編碼到線的顏色當中，則可以採用CNN從軌跡圖像中學習到有效信息[3]。

圖左側大機率爲快遞員軌跡，圖右側大機率爲汽車軌跡。GPS點的空間分佈可以爲軌跡分類提供有效信息。所以，咱們採用空間分佈模式構建模型，探索基於深度學習的軌跡分類。

軌跡顏色編碼：從GPS點中獲取的主要信息爲速度、方向、等待時長。將這3個維度的信息進行軌跡顏色編碼有2種方式，分別是RGB編碼與HSV編碼。其中HSV即色相（Hue）、飽和度（Saturation）、亮度（Value）。

因爲方向信息爲0~360度的角度值，與HSV色彩空間種的色相H徹底一致。所以，本文采用HSV色彩空間對速度、方向、等待時長進行編碼，編碼方式爲速度：V，方向：H，時長：S。編碼後將軌跡縮放爲256×256的圖片。對地圖軌跡的編碼結果以下圖所示。

5.2 雙流神經網絡模型

基於編碼生成的軌跡圖片依然缺失一些重要信息，包括將軌跡縮放至256×256圖片的縮放因子，以及GPS點所在的位置。能夠將軌跡匹配結果中經過國道、省道、城市快速路等不一樣類型道路的比例構造出特徵集表徵GPS點所在的位置信息，加入縮放因子構造一個一維靜態特徵向量。

將卷積神經網絡學習到的特徵向量以及該一維特徵向量合併，最終經過全鏈接層完成軌跡分類。最終卷積神經網絡選擇ResNet50結構。

5.3 基於深度學習的軌跡分類實驗結果

評測團隊抽樣約100個樣本，人工標記真值。

如上表所示，以人工標記標籤爲真值驗證深度學習模型，深度學習模型可以取得有效的軌跡分類精度，可是最終分類效果弱於提出的貝葉斯模型。可能的緣由有以下幾點：

ResNet50並非學習軌跡圖像的最優模型。
僅採用8月17日的樣本訓練模型，樣本多樣性不足。
所選擇的特殊場景樣本分佈與深度學習中的訓練集樣本分佈差別巨大。

6.小結

軌跡分類對於準確及時地挖掘道路封閉事件具備重要意義。本文從給予機率密度分佈的貝葉斯模型視角與基於軌跡點圖像編碼的深度學習視角分別探索了軌跡分類可能的技術方案。將來軌跡分類模型還能夠從聚焦應用場景，優化應用以及拓展上游數據，優化特徵兩個方面進行改進。

參考文獻

[1].Frénay B, Verleysen M. Classification in the presence of label noise: a survey[J]. IEEE transactions on neural networks and learning systems, 2013, 25(5): 845-869.

[2].Tanaka D, Ikami D, Yamasaki T, et al. Joint optimization framework for learning with noisy labels[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition. 2018: 5552-5560.

[3].Liu Y, Wang X, You W. Non-intrusive Load Monitoring by Voltage-Current Trajectory Enabled Transfer Learning[J]. IEEE Transactions on Smart Grid, 2018.

招聘

阿里巴巴高德地圖在線引擎和安全運維中心團隊長期招聘機器學習算法、C++、Java 資深工程師/技術專家/高級專家，職位地點：北京。歡迎投遞簡歷到 gdtech@alibaba-inc.com，郵件主題爲：姓名-應聘團隊-應聘方向。