美國陸軍研究實驗室機動與機動性事務AI與機器學習應用性能管理負責人John Fossaceca最近在一場AI大會上發表演講,分享了「AI如何應對各種平常場景?」,同時也介紹了「美國陸軍的自主機器人乃至其餘機器的將來發展方向」。算法
做者:佚名來源:科技行者|2020-08-04 10:04 收藏 分享
往往提及AI與機器人,不少人腦海中首先浮現的每每是那些「後啓示錄時代」下恐怖、且具備強大超智能的機器,它們橫行無忌、甚至佔領了整個世界乃至宇宙。電影《終結者》能夠說是人們對於AI恐懼之情的典型具象體現,其中的天網(Skynet)——以計算機爲基礎的人工智能防護系統,被影片稱爲「基於人工神經網絡的集體意識與人工通用型超智能系統」。但目前看來,AI彷佛並不像科幻小說中所描述的那樣充滿戾氣。相反,AI正在執行諸多繁瑣且傳統上只能以手動方式完成的任務,同時爲咱們帶來從識別到對話、再到預測分析模式匹配的各種自主系統。數據庫
相較於科幻片裏誇張的想象力與創造力,現實中的軍事組織在AI領域的投資卻尤其真實。以幫助人類更好地完成現有任務的角度,機器學習與AI的實現方式真沒那麼戲劇性。有趣的是,提高機器智能的過程,反而使人類得以更好地理解並控制周邊的環境。安全
美國陸軍研究實驗室機動與機動性事務AI與機器學習應用性能管理負責人John Fossaceca最近在一場AI大會上(AI in Government)發表演講,分享了「AI如何應對各種平常場景?」,同時也介紹了「美國陸軍的自主機器人乃至其餘機器的將來發展方向」。
陸軍中的AI與自主機器人,是這樣的
問:美國陸軍目前如何運用AI技術?網絡
John Fossaceca:陸軍正在以多種方式使用AI技術,例如將其引入預測性維護當中。AI技術可以幫助咱們預測,如何搶在汽車發生故障以前,替換或維修相關的零配件。作到了這一點,咱們將節約下大量金錢並提升操做安全性。目前布拉德利戰車等多種軍用載具都在嘗試這項功能。架構
陸軍方面掌握着大量數據,而AI與機器學習技術廣泛須要大規模數據支持。以Maven項目爲例,此計劃使用無人機發回的數據幫助分析人員自動完成某些軍事工做。Maven項目中就使用到一系列標準化AI工具,例如谷歌的TensorFlow,固然也配合陸軍內部構建的自定義工具。機器學習
陸軍還在積極研究,使用AI技術加強自動駕駛汽車、電子戰與信號情報、傳感器融合以及加強現實等等。AI將經過聯合全域指揮與控制(JAD-C2)等計劃,提升戰場上的態勢感知能力,最終改善軍方的決策制定水平。ide
AI在軍隊中的另外一項重要做用在於,實現更好的人才管理。目前,陸軍AI特遣隊(AITF)就在主動使用AI技術,尋求成功做戰所必需的能力與屬性,並結合這些需求物色潛在的軍事人才。工具
在做戰能力發展司令部下轄的陸軍研究實驗室(ARL)中,AI已經成爲一大主要研究領域。ARL能夠算是陸軍內部的研發中心,管理着多項AI相關計劃。以名爲「機動與機動性人工智能(AIMM)」的基本研究計劃爲例,其目標在於引導陸軍思考如何爲下一代戰鬥車輛(NGCV)在無需人爲介入的前提下得到良好的越野能力。這些下一代智能車輛,可以根據特殊狀況、環境條件作出推理,進而作出最佳行動決策,同時向士兵發出狀況通報,以提升對戰場的態勢感知水平。ARL還擁有其餘多項重要研究計劃,並着力運用AI方法在其中推進創新,相信這一切都將給將來的陸軍帶來更強的做戰能力。性能
未來,美國陸軍將使用AI技術處理來自多個傳感器的輸入數據,藉此準確描繪戰場威脅,同時加快由陸軍將來司令部領導的Convergence(融合)項目中的目標制定與目標決策過程。學習
問:採用人工智能/機器學習技術,陸軍面臨哪些挑戰?
John Fossaceca:「商業AI」依賴於龐大的計算資源與海量數據,其中雲計算資源可以及時向終端返回處理結果。但另外一方面,「戰地AI」則受限於邊緣設備——計算機處理器相對輕量化,且在戰場對抗環境下通訊帶寬可能較有限。
在陸軍的實際應用中,咱們一般得不到充足的訓練數據,現有的數據每每已經損壞或者噪聲過多。運營環境也趨於動態變化,有時會因道路、建築物以及基礎設施受損而變得混亂不堪。另外,咱們須要面對來自多個來源的異類數據,某些數據甚至具備欺騙性或者已經受到對手的操縱。
目前的AI技術每每很是脆弱,甚至在理想的運營條件下也有可能發生崩潰。其推理能力也很是有限,特別是在實時推理方面表現不佳。部分已經部署的系統雖然不斷強調其AI能力,但實際功能每每受限於硬編碼規則,而缺少從傳感器及其餘系統收集輸入內容,並作出推斷與推理的能力——更遑論提供加強型態勢評估了。
至關一部分AI方法都依賴於「監督學習」(例如深度學習),這類技術會構建起龐大的模型,一般須要在超大規模計算基礎設施之上,以「批處理」形式學習成上千萬甚至上億個參數。很明顯,陸軍須要的是可以擺脫這類束縛、真正擁有在線實時推理能力的解決方案。
最終咱們發現,現有系統並不能真正自動運行,其仍須要人爲介入、干預乃至手動控制。早在2018年,咱們就開始嘗試經過反饋進行學習,由人類觀察者向智能代理提供正面或負面信號。經過這種方式,咱們證實能夠大幅縮短學習時間。咱們將這項研究擴展並總結爲「示範學習」,稍後咱們會進一步討論這個議題。
隨着研究的深刻,咱們意識到須要一種與「智能代理」的天然交互方式。除了天然的對話與接觸以外,因爲AI缺乏對世界的認知常識與「樸素推理」能力,不少問題隨之浮出水面。咱們則經過AIMM中的第二項工做——上下文感知決策制定——努力攻克這些挑戰。
問:陸軍如何爲人工智能/機器學習項目提供數據支持?
John Fossaceca:陸軍乃至整個國防部,都在開展大規模數據收集與標記工做,藉此爲AI算法準備可用的數據資源。例如,Maven項目中就使用到大量來自無人機的視頻素材。有時候,咱們也會根據保密級別,經過衆包技術進行數據標記。其餘舉措還包括ARL的內部工做,例如從各個位置收集內部數據,並與研究合做夥伴一道整理並標記各種地形數據。ARL在馬里蘭州設有機器人研究合做園區(R2C2),在園區內收集數據並進行各種自主實驗。
除了Maven項目以外,國防部還在運用先進工具進行情報分析。其中大部分項目致力於使用深度學習方法檢測圖像中的特定對象,而實現的前提,天然是對大量數據進行清洗、整理與標記。此外,項目還要求研究人員使用存儲、算法工具包、計算資源、測試以及部署工具共同構建起AI管道。爲此,項目團隊每每須要開發出數據格式標準,以保證明驗與測試場景之間保持一致,併爲用戶提供熟悉的環境。數據存儲庫自己也須要進行分類以供用戶訪問,同時保證其中的數據隨附可用描述。爲了在多個數據庫之間實現信息訪問標準化,軍方作出一系列努力,旨在下降情報界使用AI成果的門檻。
問:陸軍如何利用自動駕駛汽車實現機動性目標?
John Fossaceca:在陸軍的機器人與自主系統(RAS)戰略中,副總參謀長Daniel B. Allyn將軍明確提到,「RAS的整合,將幫助將來做爲聯合部隊重要組成部分的美國陸軍,得到克敵制勝、控制地形、保護民衆以及鞏固利益的能力。RAS還將幫助將來的陸軍部隊得以與其餘多個領域的戰鬥行動保持統一,將力量從陸地投射至海洋、太空以及網絡等多個空間,共同維護聯合部隊的行動與做戰靈活性。」
根據RAS戰略的描述,「有效整合RAS,將提升美軍維持高強度做戰的能力,並使敵方沒法作出有效反應。陸軍必須加緊創建本身的RAS能力,這是一場與敵方比拼速度的RAS軍備競賽。一旦落後,敵方將採用一系列新策略破壞美國的軍事優點,並藉此獲悉的美國軍事體系劣勢。」
爲了實現RAS戰略的願景,自動駕駛車輛必須可以保障「機動自由」,同時下降士兵的傷亡風險。這就要求人類與機器之間實現自主協做。車輛將成爲戰場上的隊友,而再也不只是一種武器裝備。這些「人機集成小隊將幫助軍方在狀況不明的條件下探尋、適應、戰鬥並最終取勝。」
AI技術無疑是這些智能自主系統的關鍵驅動力之一。美國陸軍還必須直面客觀事實,即其對手也將使用自主系統。在自主水平不斷升級的背景下,機器人自主系統將再也不依賴於通訊鏈路——由於干擾及傳輸容量的限制,通訊鏈路在戰場條件下幾乎得不到任何保障。
從優先級角度出發,RAS戰略要求在短時間內改善態勢感知水平,並幫助減輕士兵的體力負擔。着眼於中期,「自主車輛行動」不只有助於維持戰場形勢,同時也將爲士兵提供掩護。最終從長遠來看,自動駕駛汽車將得到執行先進戰術的能力,進而「提升旅級戰鬥團隊的能力」。
問:哪些獨特的環境挑戰,會影響到自動駕駛汽車與設備的研究工做?
John Fossaceca: 除了複雜的地形與非結構化環境以外,敵對方也有可能對陸軍的做戰環境帶來不可預測的影響。陸軍的研究,專門針對所謂「戰術行爲」,即自動駕駛汽車應該採用怎樣的特定形式?自動駕駛汽車如何在兩軍對抗中奪取優點地位?自動駕駛汽車如何在不被敵軍發現的狀況下運行?陸軍已經就此作出深刻研究,並着力保證下一代做戰車輛可以推理出全部潛在路線——甚至包括涉水路線。
問:ARL在無人駕駛汽車方面的研究,與民用行業的研究有何不一樣?
John Fossaceca:在陸軍做戰環境中,一般很難收到規模化、與軍事相關且具備明確標記的數據,所以ARL一直高度關注AI算法,但願探索出一條對數據依賴性遠低於傳統監督方法的新道路。與此相匹配,陸軍將針對場景分割等用例,開發「無監督方法」,但願實現對數據的自動標記。
然而,這樣的方法目前仍然須要大量算力,所以很難在自動駕駛車輛上實時完成處理。爲了解決這個問題,陸軍邀請多位計算機科學家,由他們專職研究計算機架構與算法,旨在經過先進方法幫助陸軍在自動駕駛車輛可以支持的處理器尺寸與功率限制內,達成預期效果。
陸軍顯然面臨着商業部門不可思議、也徹底沒法解決的獨特技術挑戰。商用自主車輛不須要過多考慮運行環境中的破壞性因素——除了人員、障礙物甚至是意外事件,軍事行動每每發生在極不肯定的環境當中,地形危險而複雜、敵對方也可能設下種種威脅陷阱。
首批實例將採用遠程操做形式,陸軍也將在遙控過程當中逐步摸索出此類車輛的操做方式,學習如何在戰場上使用機器人。以此爲依據,咱們將瞭解應該開發出怎樣的自主行爲。最終,下一代戰鬥車輛將擁有現場學習、形勢適應、推理以及有效採起行動,以支持多領域做戰任務的能力。
問:面對AI挑戰,您有哪些經驗之談?
John Fossaceca:近期的陸軍研究發現,利用人類示範與反饋的深度強化學習技術已經取得了成功。這些新型方法的成功,大大減小了在新任務中訓練系統的時間週期。
而經過人類演示的其餘研究代表,即便只使用有限的示例,一樣能夠在戰場上經過再訓練得到必定程度的實用性、甚至是實時學習的潛力。這些技術彷佛還可以與遷移學習相融合,即在一組條件下學習,並將模型成果引入至另外一組全新條件,且無需從零開始從新訓練。
問:在美國陸軍看來,將來的戰場與士兵將呈現出怎樣的面貌?
John Fossaceca:在美國陸軍看來,將來的戰場上將出現無人編隊,其速度遠超當前人員編隊。其中一項目標,是讓自主系統對區域及路線進行偵察,發現或與敵方接火,同時爲士兵提供防護支援。
問:AI技術對於陸軍的將來發展願景有何重要意義?
John Fossaceca:AI技術將成爲將來多域做戰中取得成功的關鍵驅動力。根據前陸軍部長兼現任國防部長Mark Esper的說法,「若是咱們可以掌控AI,那麼它必定可以更好地保護美國人民。要在將來的戰場上取勝,咱們就須要比敵人更快行動,同時儘量下降部隊與資源的風險等級。誰能先實現這個目標,誰就將在將來幾年的戰場上保持決定性的優點。」
現任陸軍部長Ryan McCarthy則表示,基於雲的技術與功能將成爲「AI最大化」道路上的核心因素。McCarthy但願全面推廣雲基礎設施部署,藉此推進AI技術發展。
問:陸軍對於「以符合道德及負責任的方式使用AI技術」有何見解?
John Fossaceca:美國陸軍及國防部都在高度關注AI倫理問題,並於去年10月提出了《關於以符合倫理道德的方式使用人工智能的建議》草案。這些規則也將適用於美國軍隊。美國軍方將招納人才,保證全部AI系統都有對應人員負責管理。
陸軍的AI特遣隊也設有一位道德官員,可協助通報AI道德政策。陸軍部長Ryan McCarthy表示,「系統能夠快速處理數據並提供答案,但卻沒法提供上下文信息。只有人類才能根據實際環境作出決策。」
問:目前,您採起哪些措施保證軍方可以擁有充足的AI相關人力與做戰人員儲備?
軍方內部是否正在開展AI相關培訓與教育計劃?John Fossaceca:ARL與陸軍爲學生提供大量實習機會與SMART獎學金,這些獎學金能夠幫助學生支付教育費用。而做爲交換,學生將爲陸軍工做一段時間。ARL還聘用了新的博士畢業生進行博後研究,藉此將他們帶入前沿研究領域。最終,部分博士後將成爲內部員工。人工智能已經成爲當前的核心研發方向,所以陸軍也將逐步僱用更多具有這方面專業知識的科學家與工程師。
問:在幫助士兵適應與自主系統及機器人協同方面,您作了哪些嘗試與努力?
John Fossaceca:咱們以前討論的各種自主系統仍在開發當中,所以目前咱們只能在訓練環境內使用仿真技術幫助士兵適應這些自主系統。陸軍在這方面尚處於起步階段,但確實正在推動部分計劃,例如可重構虛擬集體教練機(RVCT)及其包含的地面與空中平臺,這些平臺可以使用模擬數據實現多種演練任務。
目前的大部分訓練工做都集中在對「智能半自主系統」與「自主系統」的仿真模擬方面,這是爲了給士兵提供身臨其境的訓練體驗。士兵們在這類綜合訓練環境(STE)中與虛擬對手對抗。這些虛擬對手可以實施各種智能行爲,其中甚至包含必定的不可預測性,用以模擬敵對方可能作出的選擇以及合理的認知水平。這必然須要將最早進的人工智能與現實環境結合起來。
在基礎研究層面,ARL則引導士兵與自主原型方案進行交互,幫助AI系統熟悉士兵的說話方式,以及他們傾向於使用哪些命令。反過來,士兵也將逐漸摸清AI系統的「脾氣」。實際上,在引導士兵與自主系統協同訓練以後,士兵們很快就開始嘗試以更適合對方的語言進行表達,從而高效完成溝通與系統控制。
問:將來幾年,您最期待哪些AI技術?
John Fossaceca:咱們在使用人工智能進行環境推理方面取得了長足的進步,也可以向士兵隊友們推薦具體的行動方案。這表明着咱們的人工智能正從「窄AI範疇(即只能完成某些高度具體任務的自主代理)」向真正具有新狀況適應能力的方向升級。
將來,這些AI代理將可以肯定哪些行動具備可行性,以及每種選擇所對應的成功機率。這雖然還不能算是「人工通用智能」,但已經可以以接近人類的水平執行推理。將來,咱們但願讓自主系統可以根據特定狀況作出複雜推理、執行復雜決策,並預測各種可能的結果,以最大程度提高任務的成功概率。
【責任編輯:龐桂玉 TEL:(010)68476606】