在2018 AI開發者大會(AI NEXTCon)上,美團配送AI方向負責人何仁清,分享了美團在即時配送領域中機器學習技術的最新進展,以及如何經過大數據和機器學習手段,創建對線下真實世界各類場景的感知能力,還原並預測配送過程各個細節,從而提高總體配送系統的精度。算法
2014年,斯嘉麗·約翰遜主演的科幻片《超體》大火,影片中主人公Lucy因爲無心中攝入了大量的代號爲「CPH4」的神祕藥物,大腦神經元得到空前的開發,得到了異乎尋常的超能力,她可以對這個世界進行全新的感知、理解和控制(好比控制無線電波),最終跨越時間和空間成爲了一個超級個體。安全
這種對真實世界的深度感知、理解和控制,與配送AI系統對配送場景的感知、理解和配送環節控制的目標很是一致。能夠說,美團要建設的AI就是配送系統的「超級大腦」。所以咱們內部把配送的AI系統,簡稱爲「超腦」配送系統。網絡
最近幾年,之外賣爲依託,即時配送業務在全球範圍內掀起了一波快速發展的浪潮,全球各地都出現了不少創業公司,其中國外知名的包括美國的Uber Eats(全球)、英國的Deliveroo、印度的Swiggy、Zomato(分別被美團和阿里投資),印尼的go-jek等等。國內除了美團外賣、餓了麼、滴滴外賣等典型表明外,而還有專一於即時配送服務創業公司,好比閃送、UU跑腿、達達、點我達等。機器學習
這種全球爆發的現象說明了兩個問題:學習
即時配送,是一種配送時長1小時之內,平均配送時長約30分鐘的快速配送業務。如此快速的配送時效,將傳統的線上電商交易與線下物流配送(傳統劃分比較明確的兩條業務)整合爲統一總體,造成了用戶、商戶、騎手和平臺互相交錯的四元關係。大數據
其整協力度空前緊密,幾乎滲透到各個環節。之外賣搜索和排序爲例,在下午時段,在用戶搜索和推薦中能夠看到更多的商家,由於此時運力充分,能夠提供更遠距離的配送服務,不只能更好知足用戶的需求,提升商家的單量,並且可以增長騎手的收入。優化
即時配送的核心指標是效率、成本、體驗,這三者也造成了即時配送的商業模型。簡單來講能夠分爲如下幾步:3d
這樣,就造成了一個正向循環,不斷創造更多商業價值。而技術的做用,就是加速這個正向循環。cdn
目前互聯網技術,很大部分仍是針對線上產品和系統研發,整個流程能夠在線上所有完成,而這也正是配送AI技術最大的不一樣和挑戰。簡單來講,相似搜索、推薦、圖象和語音識別這種線上產品經常使用的AI技術幫助不大,由於配送必須在線下一個一個環節的進行,這就要求AI技術必須可以面對複雜的真實物理世界,必須能深度感知、正確理解與準確預測、並瞬間完成複雜決策。blog
爲了知足這些要求,咱們建設了美團「超腦」配送系統,包含如下幾個方面:
如何構建一個在真實物理世界運行的AI系統,就是咱們最大的挑戰。具體到機器學習方向而言,挑戰包括如下幾個方面:
精度足夠高、粒度足夠細
線下數據質量的巨大挑戰
ETA(Estimated Time of Arrival,時間送達預估)是配送系統中很是重要參數,與用戶體驗、配送成本有直接關係,並且會直接影響調度系統和訂價系統的最終決策。
一個訂單中涉及的各類時長參數(如上圖右側所示),能夠看到有十幾個關鍵節點,其中關鍵時長達到七個。這些時長涉及多方,好比騎手(接-到-取-送)、商戶(出餐)、用戶(交付),要經歷室內室外的場景轉換,所以挑戰性很是高。
經過機器學習方法,咱們已經將外賣配送幾乎全部環節都進行了精準預估預測。用戶感知比較明顯是預計送達時間,貫穿多個環節,商家列表(從配送時長角度讓用戶更好選擇商家)、訂單預覽(給用戶一個準確的配送時間預期)、實時狀態(下單後實時反饋最新的送達時間)。固然這裏面還有不少用戶看不到的部分,好比商家出餐時間、騎手到店時間、交付時間等。其中交付時長,與用戶關係比較大,也頗有意思,下文會詳細展開。
交付時長是指騎手到達用戶後,將外賣交付到用戶手中並離開的時間,實際是須要考慮三維空間內計算(上樓-下樓)。交付時間精準預估,有兩點重要的意義,首先是客觀的衡量配送難度,給騎手合理補貼;其次,考慮對騎手身上後續訂單的影響,防止調度不合理,致使其餘訂單超時。
交付時長的目標是,作到樓宇和樓層的精準顆粒度,具體能夠拆解爲如下幾步:
能夠看到,真實世界中影響決策因素很是多,咱們目前作的還不夠。好比交付時長也能夠進一步細化,好比準確預估騎手上樓時間、下樓時間和等待時間,這樣其實可以與商家取餐環節保持一致,之因此沒這麼作,主要仍是數據缺失,好比騎手在商家其實有兩個操做數據(到店、取餐),這樣能支持咱們作精細化預估的,可是在用戶環節只有(送達)一個操做。
舉這個例子,實際上是想說明,數據的完備性對咱們到底有多重要。數據方面的挑戰,線下業務與線上業務相比,要高出好幾個等級。
地圖對配送的重要性毋庸置疑(位置和導航都不許確,配送如何進行?),前面提到的5級地址庫只是其中一部分。配送地圖的目標能夠歸納爲如下兩點:
若是橫向對比配送、快遞、打車等行業對地圖的要求,實際上是一件頗有意思的事情,這個對於配送地圖技術建設來講,是一件很是有幫助的事情。
從這兩方面對比能夠看到,在即時配送業務中,騎行地圖的重要性很是之高,同時不少問題確實很是具備行業特點,經過駕車地圖的技術沒法頗有效的解決。這樣就須要建設一套即時配送業務地圖的解決方案。
如前文所述,配送地圖的方向有不少,此次我重點講一下用戶位置相關的工做「交付點挖掘」。首先看一下目前主要問題:用戶位置信息有不少錯誤,好比:
上圖左,一個小區會有1期2期~N期等,用戶在選擇POI的時候就可能發生錯誤(好比1期的選了2期),二者地理位置相差很是遠,很容易形成騎手去了錯誤的地方。這樣在訂單發送到配送系統的時候,咱們須要作一次用戶座標糾正,引導騎手到達正確的位置。
上圖右,用戶原本在xx區xx棟,可是隻選了xx區這個比較粗的位置信息。現實中在一個小區裏面,找到一個具體xx棟樓仍是很是困難的,你們能夠想一想本身小區中,隨便說一個樓號你知道它在哪一個角落嗎,更別說若是是大晚上在一個你不熟悉的小區了。形成這種緣由,一方面多是用戶選擇不精細,還有一種可能,就是地圖上沒有具體樓棟的POI信息。
在實際配送中,咱們都會要求騎手在完成交付後進行簽到,這樣就會積累大量的上報數據,對於後續進行精細化挖掘很是有幫助。你們能夠先看看咱們收集的原始數據(上圖),雖然仍是很是凌亂,可是已經能看到這其中蘊含着極高的價值,具體來講有三方面:
在數據挖掘實際過程當中,其實並無什麼「高大上」的必殺技,沒法使用流行的End2End方法,基本上仍是須要對各個環節進行拆解,紮紮實實的作好各類基礎工做,基本整個挖掘過程,分爲如下幾個步驟:(1)基於地址分組;(2)數據去噪;(3)數據聚合;(4)置信度打分。其中主要技術挑戰,主要在各類場景中保證數據挖掘質量和覆蓋率,具體來講主要有三個挑戰:
目前,咱們已經上線了一版交付點,對用戶位置進行主動糾正,讓騎手能夠更準確更快的找到用戶。目前效果上看仍是很是明顯的。包括幾個方面:
前面提到的地圖技術,只能解決在室外場景的位置和導航問題。但配送在商家側(到店、取餐)和用戶側(到客、交付)兩個場景中,實際上是發生在室內環境。在室內的騎手位置是在哪裏、在作什麼以及用戶和商家在作什麼,若是瞭解這些,就能解決不少實際問題。好比:
這個技術方向能夠統稱爲「情景感知」,目標就是還原配送場景中(主要是室內以及GPS不許確),真實配送過程發生了什麼,具體方向以下圖所示:
情景感知的目標就是作到場景的精細刻畫(上圖的上半部分),包含兩個方面工做:
這些數據,大部分來至於手機,可是隨着各類智能硬件的普及,好比藍牙設備,智能電動車、智能頭盔等設備的普及,咱們能夠收集到更多數據的數據。WiFi/藍牙技術,以及運動狀態識別的技術比較成熟,這裏主要說一下概況,本文不作深刻的探討。
對於配送系統來講,比較大的挑戰仍是對識別精度的要求以及成本之間的平衡。咱們對精度要求很高,畢竟這些識別直接影響訂價、調度、判責系統,這種底層數據,精度不高帶來的問題很大。
考慮成本限制,咱們須要的是相對廉價和通用的解決方案,那種基於大量傳感器硬件部屬的技術,明顯不適用咱們幾百萬商家,幾千萬樓宇這種量級的要求。爲此,在具體技術方面,咱們選用的是WiFi指紋、藍牙識別、運動狀態識別等通用技術方案,就單個技術而言,其實學術界已經研究很充分了,並且也有不少應用(好比各類智能手環等設備)。對於咱們的挑戰在於要作好多種傳感器數據的融合(還包括其餘數據),以確保作到高識別精度。固然爲了解決「Ground Truth」問題,部署一些穩定&高精度的智能硬件仍是必須的,這對技術迭代優化和評估都很是有幫助。
美團外賣日訂單量超過2400萬單,已經佔有了相對領先的市場份額。美團配送也構建了全球領先的即時配送網絡,以及行業領先的美團智能配送系統,智能調度系統每小時路徑計算可達29億次。如何讓配送網絡運行效率更高,用戶體驗更好,是一項很是困難的挑戰,咱們須要解決大量複雜的機器學習和運籌優化等問題,包括ETA預測,智能調度、地圖優化、動態訂價、情景感知、智能運營等多個領域。過去三年來,美團配送AI團隊研發效果顯著,配送時長從一小時陸續縮短到30分鐘,而且還在不斷提高,咱們也但願經過AI技術,幫你們吃得更好,生活更好。
目前,即時配送業務正處於快速發展期,新的場景、新的技術問題不斷涌現,團隊正在迅速擴大中,急需機器學習資深專家、運籌優化技術專家、LBS算法工程師、NLP算法工程師,咱們期待你的加入。掃碼可查看職位詳情,或者發送簡歷至 yewei05@meituan.com