掃福得福背後,支付寶 AR 紅包的技術創新與故事

春節期間,支付寶的「掃福得福」活動火爆異常。AR 是一種新的交互方式,與傳統營銷方式相比,可使用戶更深刻地參與互動,給用戶帶來新體驗。而支付寶紅包,寄託着用戶對將來的期盼,所以其團隊就考慮將 AR 與紅包相結合,探索一種新的玩法。在 AR 領域走在前面的支付寶,其 AR 紅包的技術選型、技術架構及其背後的技術故事都有哪些?算法

寫在前面

2004 年 12 月 12 日,我加入雅虎中國,也加入了互聯網大軍。至今,我還依稀記得,當時心中那種對互聯網的敬畏之情。2009 年,在雅虎的四年外企生活一晃而過,我有幸加入支付寶團隊,並參與支付寶無線支付。從那以後,我天天都要接受無線浪潮的洗禮,人生軌跡今後也發生了鉅變。安全

今天是我到阿里的第 4096 天,談起「紅包」,讓我回憶起了,2015 年參加第一次支付寶春節口令紅包項目,團隊得到螞蟻金服 CEO 大獎;2016 年負責識別猴子,開始具備了 AR 雛形,後續又提出了兒童時代「集卡片」玩法,可謂集五福前身;2016 年開始建造支付寶 AR 系統,全面支撐了 2017 年 AR 實景紅包、AR 掃福等一系列活動……服務器

提到AR紅包,這是咱們團隊的一次大膽創新,如今就來和你們分享一下支付寶 AR 紅包背後的技術和故事。架構

支付寶 AR 紅包背景

AR 的發展和舊玩法

AR 是加強現實技術的簡稱,其歷史能夠追溯到 1968 年——哈佛大學電氣工程副教授薩瑟蘭,發明了名爲「達摩克利斯之劍」的頭戴式顯示設備。併發

1998 年,在當時的體育轉播圖文包裝和運動數據追蹤領域領先的公司 Sportvision,在橄欖球賽的電視轉播上使用了 AR 技術,將得分線疊加到了屏幕中的球場上。此後,AR 技術開始被用於天氣預報——將計算機圖像疊加到現實圖像和地圖上面,從那時起,AR 才真正地開始了其爆炸式的發展。高併發

1999 年,加強現實開發工具 ARToolKit 便問世了,不少開發者加入這個行業,推進領域向前發展。目前 Microsoft、Google、Apple 等公司都在 AR 領域進行了大規模投入,旨在推進下一代視窗交互系統的變革。工具

爲何要作支付寶 AR 紅包
AR 是一趟奔馳的列車,從我的到團隊,從團隊到公司,都但願搭上這趟列車,可是如何搭上,用何種技術搭上都是新的挑戰。性能

AR 是一種新的交互方式,與傳統營銷方式相比,可使用戶更深刻地參與互動,給用戶帶來新體驗。而支付寶紅包,寄託着用戶對將來的期盼,所以團隊就考慮將 AR 與紅包相結合,探索一種新的玩法。開發工具

AR 新玩法
2015 年,咱們開始關注AR這個領域,當時爲2016年制定的一個新春紅包方案就是用手機識別猴子。這個方案讓你們有了AR的感受,項目組也想作一些AR的創新玩法。可是,因爲當時相關技術儲備不足,就放棄了。優化

方案雖然放棄了,但探索AR的新玩法這件事,深深地烙在了咱們的內心。2016 年一開春,咱們創新組就開始儲備相關技術知識:識別跟蹤算,OpenGL、3D渲染引擎,建模能力,AR體系架構,等等。這些相關技術也陸續在小視頻美顏、人臉貼圖等社交場景進行了實踐,爲後續AR相關技術快速成型提供了保障。

如何推動 AR 的新玩法呢?當時,咱們團隊定下了兩個目標,一是找一個小場景落地 AR 概念,二是在春節紅包上使用AR技術,後者是咱們的年度終極目標。2016 年的「中秋節掃月亮」,算是支付寶在 AR 領域的第一次嚐鮮,體驗和反響還不錯。邁出這第一步以後,各類業務需求也接踵而來,AR 新玩法也愈來愈多——雙12線下商圈「掃雙 12 集四寶」的活動,2017 年春節AR實景紅包,掃可口可樂福娃領紅,掃福集福……

支付寶 AR 紅包帶來的挑戰
新玩法天然會帶來新挑戰,不說別的,單單用怎麼樣一種方式呈現 AR 紅包,就是很是大的挑戰。大多數 AR 的玩法都是針對預設的2D圖片,離線訓練好識別模型,而後在此基礎上實現識別互動。因爲是2D圖片而且預先驗證過,所以能較好的保證識別的效果。支付寶AR實景紅包算是業界的一次大膽嘗試。用戶自由選擇真實3D場景,拍攝一張圖片做爲線索圖,其餘人根據線索圖到指定位置拍攝圖片進行比對。而這種方式呈現AR紅包,天然也對圖像匹配的算法性能提出了新的挑戰,主要涉及以下方面。

  1. 算法魯棒性:因爲針對真實的 3D 場景拍照,匹配算法須要容忍必定的遮擋和角度、距離、光線、圖片質量等的變化;
  2. 計算複雜度:因爲在終端上進行實時匹配,算法的複雜度不能過高,不然會致使用戶尋找紅包時間變長,手機功耗消耗過大等問題;
  3. 手機流量:移動端應用須要考慮用戶的流量問題,須要在數據大小和識別率之間作好平衡;
  4. 手機兼容性:對擁有億級用戶的支付寶而言,機型特別是Andriod機型分佈很廣。對於咱們3D模型渲染帶來了很大的挑戰,須要制定完善的兼容性方案,確保AR功能的正常使用。

AR實景紅包的技術選型
AR紅包的初期方案也和不少已有的產品相似,僅依靠 LBS 和手機陀螺儀來進行互動:用戶在某個位置發一個紅包,其餘人到達這個地點後打開攝像頭,朝着某個方向拍攝就能看到別人發的紅包。這個方案因爲僅依賴 LBS 和手機陀螺儀,方案比較成熟,但主要存在兩個問題:

定位精度
產品初期的定位是讓附近的人領取紅包(好比附近幾十米的人或者同一層樓的人),這對近距離定位要求就很高。內部也討論了不少潛在的方案,好比結合WiFi定位、室內定位等等,但都不是很通用或者不成熟,沒有很好的解決方案;

主觀體驗:因爲 GPS 和陀螺儀的數據自己就存在較大的偏差,位置定位和用戶動做都沒法精確度量,用戶體驗不太好,沒有真實的藏↔找的體驗。

所以在 AR 紅包中,咱們但願可以從新設計交互方式,提出了圖片匹配方案。在發紅包時,用戶對着場景拍攝一張圖;其餘人想要領取紅包,必須到達該位置而且對着同一場景拍攝,只有位置和圖片匹配才能領取,大大增長了精確度和用戶趣味性。最終該方案被採納,誕生出了 AR 實景紅包。

AR 實景紅包最終的技術架構

AR 實景紅包

整個 AR 實景紅包由兩個場景組成:一是藏紅包,用戶對着某場景拍一張圖,將紅包藏在這個場景裏面;二是找紅包,用戶在地圖頁選擇一個紅包,經過線索圖走到對應地點,打開攝像頭拍攝進行圖片比對,匹配成功後領取紅包。
在這裏插入圖片描述
藏紅包
並非全部的場景都適合藏紅包,好比白牆處處可見,會形成線索圖不惟一的狀況。所以在藏紅包時,咱們會校驗當前場景是否知足預設要求。藏成功後,拍攝的圖片會傳到服務端處理:一是將圖片轉成特徵碼用於圖片匹配,二是生成一張線索圖用於找紅包。

找紅包
根據用戶當前的位置,服務端會下發附近的紅包信息。用戶經過紅包列表能夠選擇領取某一個紅包,此時客戶端會到服務端拉取該紅包的特徵碼和線索圖。線索圖在本地展現,提示用戶紅包的樣子。特徵碼用於客戶端本地實時比對。用戶找紅包時,將攝像頭採集的圖像轉換成特徵碼,與服務端下發的紅包特徵碼進行比對,若是本地匹配成功,則把圖片信息傳到服務端作二次校驗來防止做弊。服務端校驗經過後,紅包就能夠領取了。

掃福得福
在掃福字得福卡的活動中,爲了解決高併發的問題,採用了客戶端 + 服務端並行處理的架構體系,可支持兩種識別方式:

  • 全部圖片都傳至服務端作處理,這樣識別精度更高,可是服務器端能處理的數量有限;二是先走客戶端檢測,客戶端沒法識別的再上傳服務端。客戶端檢測能力稍弱,但將計算能力分散到各終端,能極大緩解服務端的壓力。
  • 活動開啓後,因爲用戶的積極參與,咱們在活動早期就打開了客戶端識別,使得系統順利支撐了 14 萬次 /秒的福字識別峯值,確保了整個活動的順利進行。可是客戶端的識別精度有限也致使了不是福字被是被爲福字的問題,這個也是咱們後續的優化方向。

如何防冒領
正經常使用戶要成功領取紅包,須要按照線索圖的提示找到紅包隱藏地點並完成實景拍攝,也就是說位置+像匹配兩個條件都須要知足,才能夠領紅包。AR實景紅包上線之初,爲了讓用戶有較好的體驗,線索圖作的比較簡潔美觀。初版線索圖是經過添加均勻的橫條紋蒙版(相似百葉窗效果)來對原圖進行遮擋,同時確保用戶能簡單的識別出圖片。

可是,因爲該方案比較簡單,部分用戶經過PS線索圖來補全被遮擋部分,後續甚至出現了自動化的PS工具。咱們隨後進行了升級,每一個紅包的線索圖都是動態選擇一個蒙版,蒙版還會隨機的動態旋轉/偏移等。新的線索圖方案,大大增長了自動化 PS 的難度,基本解決了PS的問題。

除了對付圖片的攻擊外、對於 LBS 篡改等其餘做弊手段,螞蟻安全團隊也作了大量的防控技術手段,經過對用戶的行爲數據來分析潛在的做弊用戶,也有效地攔截了大部分做弊用戶。

AR 的將來
AR 是一種新穎的交互形式,雖然該領域已經有了不少年的發展歷程,但技術成熟度和用戶普及度都不是很高。目前市面上的 AR 應用場景仍是比較窄的,仍然有不少挖掘的空間,特別是結合各行業自身的特色去思考,確定會產出不少好的創意玩法。AR 紅包正式上線時,那幾天地圖頁都是滿滿的紅包,咱們也很興奮,說明你們對這個新鮮事物都很感興趣而且可以接受。除了我的紅包玩法,不少商家對這種新型互動方式更加感興趣,也主動聯繫咱們。商家但願用戶經過拍攝本身的品牌 Logo 來加深用戶對品牌的認知,認爲這是一種新穎的營銷方式,將來還會有更多的成長空間。

後續咱們會朝着 AR 開放平臺的方向發展,提供一個開放的 AR 平臺讓更多商家和用戶都參與進來。同時,結合線下支付場景,圍繞用戶體驗,打造更多的創新產品。

寫在最後

初版Windows Mobile錢包的誕生讓我完成向移動轉型,接着,我帶領團隊經歷了 Symbian 從鼎盛到衰退,而後又經歷了 WP 項目的糾結,經歷了 Android 從開發版到如今的家喻戶曉,經歷了 iOS 從奇怪的語法到後來輕車熟路……

技術在發展,而咱們在不斷地創新。2013年開啓了支付寶聲波支付,2014 年銀行卡識別和身份證識別用於錢包業務……同時,團隊相關算法技術、工程能力和創新思惟在這個過程當中也獲得很大的沉澱,爲連續三年參與紅包項目奠基了基礎,爲今年 AR 紅包的新玩法奠基了基礎。能力越大,責任也就越大,既然承擔起了這份責任,我相信咱們的努力定會不負使命。

做者介紹
何強(花名:何武),2001 年畢業於北京工商大學,2004.12.12 加入中國雅虎,參與雅虎通等客戶端研發工做。2009 年轉戰支付寶無線事業部,參與支付寶初版客戶端研發,前後負責過 Symbian 團隊、WP 團隊、開放平臺團隊、創新團隊等。在阿里期間,參與過無線的每次變革,引領過相關新技術用於錢包應用,如:聲波用於支付、識別銀行卡用於綁卡、OCR 用於實名認證、音頻處理用語音降噪、圖像處理用於美顏貼圖、AR 綜合技術用於紅包等,所帶團隊連續三年承擔紅包重要角色,擅於與兄弟團隊合做,融合相關產品和技術,促進新技術落地。目前就任於支付寶多媒體創新團隊,協助主管朝山推進多媒體向前發展,探索更多新領域。

原文來自:InfoQ;原文連接:https://www.infoq.cn/article/story-and-technology-innovation-of-alipay-ar-hongbao
點擊閱讀更多,查看更多詳情

相關文章
相關標籤/搜索