摘要
隨著網(wǎng)格細胞、位置細胞及頭朝向細胞等類腦認知導(dǎo)航細胞的作用被揭示、人工智能的快速發(fā)展以及群體智能感知定位機理的蓬勃發(fā)展,為研究無人機集群編隊復(fù)雜飛行環(huán)境下的類腦編隊協(xié)同導(dǎo)航技術(shù)提供了理論基礎(chǔ)。針對無人機類腦集群編隊導(dǎo)航技術(shù)的研究進展進行如下綜述。
1) 論述無人機類腦編隊導(dǎo)航系統(tǒng)的研究現(xiàn)狀;
2) 分析無人機類腦感知定位機理及智能自適應(yīng)建模方法的研究,包括基于深度強化學(xué)習(xí)的類腦導(dǎo)航模型;
3) 提出目前類腦編隊導(dǎo)航系統(tǒng)中面臨的重難點及未來發(fā)展趨勢。
引言
無人機的飛行任務(wù)已逐步從單無人機自主飛行向多無人機集群編隊自主飛行方向發(fā)展。在軍事領(lǐng)域,多無人機集群編隊協(xié)同飛行可以有效克服復(fù)雜戰(zhàn)場飛行環(huán)境下僅依賴單架無人機執(zhí)行任務(wù)能力有限、抗毀傷性不足等問題。在民用領(lǐng)域,多無人機密集集群編隊協(xié)同飛行可應(yīng)用于災(zāi)害救援、科學(xué)考察和航空飛行表演等多種應(yīng)用領(lǐng)域,特別是采用多旋翼無人機按照預(yù)定的飛行航路實現(xiàn)密集集群編隊飛行在民用航空飛行表演等領(lǐng)域得到成功應(yīng)用。由于無人機具備功能分布化、體系生存率高、成本低、效率高等優(yōu)勢,必將在軍事作戰(zhàn)、救災(zāi)搶險、精密農(nóng)業(yè)、線路巡檢、測繪測量、安全監(jiān)視等軍民領(lǐng)域獲得廣泛應(yīng)用,有著廣闊的應(yīng)用前景。
現(xiàn)有的無人機集群編隊協(xié)同導(dǎo)航普遍基于GPS或差分GPS等衛(wèi)星導(dǎo)航信號進行編隊協(xié)同導(dǎo)航定位,這種導(dǎo)航定位方式對衛(wèi)星導(dǎo)航信號以及地面主控站表現(xiàn)出較強的依賴性,當GPS信號受到干擾或者主控站信號丟失時,無人機集群導(dǎo)航性能將無法得到保障。此外,除GPS等衛(wèi)星導(dǎo)航傳感器外,雖然還能夠在每架編隊無人機上進一步裝載慣性傳感器、地磁、大氣傳感器、視覺、光流、UWB和WIFI等多種傳感器以進一步提高無人機自身的感知定位精度與可靠性,但是面對集群編隊多源傳感器海量數(shù)據(jù)的處理,依靠現(xiàn)有的有中心節(jié)點式的無人機編隊集群導(dǎo)航技術(shù)顯然還無法滿足對海量可用導(dǎo)航信息的甄別篩選以實現(xiàn)對海量感知定位信息的最優(yōu)融合。近年來,類腦感知和認知機理的研究得到迅猛發(fā)展。神經(jīng)科學(xué)家逐漸揭示了人體大腦中位置細胞、頭朝向細胞、網(wǎng)格細胞之間的作用機理,并進一步闡明了人體大腦進行位置定位和方向感知的方式。此外,鳥群、蜂群、魚群和蟻群等生物腦的感知定位機理研究也正處于蓬勃發(fā)展的階段,為類腦處理的人工智能發(fā)展提供了新的思路和發(fā)展方向,類腦感知智能已成為近年來人工智能領(lǐng)域研究的熱點,為無人機集群導(dǎo)航提供了新的思路和途徑。
1 類腦集群導(dǎo)航系統(tǒng)的研究現(xiàn)狀
1.1 無人機集群導(dǎo)航系統(tǒng)研究現(xiàn)狀
美國等西方發(fā)達國家在基于類腦感知的人工智能編隊無人機導(dǎo)航方面開展了很多探索性研究。2016年10月,美國國防部采用3架F/A-18戰(zhàn)斗機發(fā)射了103架“山鶉”( Perdix) 微型固定翼無人機并組成集群,通過空中實驗驗證了無人機集群飛行的能力,研究者通過對鳥集群飛行時的腦機理研究出共享分布式大腦,通過相互協(xié)調(diào)行動,盡管在實際飛行過程中仍然依賴一臺地面站作為數(shù)據(jù)中心,但是也表明了“山鶉”無人機已經(jīng)初步具備了集群編隊協(xié)同環(huán)境類腦感知定位能力; 2010年賓夕法尼亞大學(xué)完成20架四旋翼無人機的類腦編隊控制; 2015年法國達索飛機制造公司實現(xiàn)神經(jīng)元無人機與陣風(fēng)戰(zhàn)斗機、“獵鷹7X”商務(wù)機的有人機/無人機類腦協(xié)同編隊飛行。
美軍“蟬”微型無人機集群編隊
美海軍“低成本無人機集群技術(shù)項目”
國內(nèi)也高度重視人工智能與無人機導(dǎo)航相結(jié)合的研究,其中控制領(lǐng)域的類腦感知研究者較多,還未將類腦應(yīng)用于導(dǎo)航領(lǐng)域。與國外相比,在技術(shù)實現(xiàn)上還存在一定差距。
1.2 類腦導(dǎo)航系統(tǒng)研究現(xiàn)狀
類腦感知定位不是單純地復(fù)制生物大腦,而是從原理及結(jié)構(gòu)上尋找生物大腦的優(yōu)勢,從而對人工神經(jīng)網(wǎng)絡(luò)進行完善。在類腦導(dǎo)航細胞機理基礎(chǔ)上,昆士蘭大學(xué)開發(fā)了類腦機器人視覺導(dǎo)航算法,首次用低成本相機實現(xiàn)了城市級的車載導(dǎo)航與定位能力,相比傳統(tǒng)視覺導(dǎo)航,具有惡略環(huán)境( 暗光強光、粉塵等) 適應(yīng)性 強、無需精確導(dǎo)航計算模型等優(yōu)勢。波士頓大學(xué)提出一種仿大腦海馬結(jié)構(gòu)認知機理的面向目標導(dǎo)航模型,通過分析頭朝向細胞、網(wǎng)格細胞、位置細胞以及前額葉皮層細胞各自的功能和聯(lián)系,建立對應(yīng)作用機理的分 級人工神經(jīng)網(wǎng)絡(luò)模型,實現(xiàn)了基于慣性/視覺的類腦認知導(dǎo)航。昆士蘭科技大學(xué)提出了基于視覺/WIFI /氣壓計的類腦多源信息融合算法,具有不依賴精確導(dǎo)航建模能力。谷歌DeepMind人工智能研究團隊驗證了把神經(jīng)網(wǎng)絡(luò)模型用于空間導(dǎo)航和定位時,其隱節(jié)點的物理意義類似于大腦位置細胞、網(wǎng)格細胞、邊界細胞等導(dǎo)航細胞,首次證明了類腦認知導(dǎo)航與大腦導(dǎo)航生理機制等價。哥倫比亞大學(xué)首次采用類腦芯片IBM TrueNorth實現(xiàn)了智能小車環(huán)境感知、空間導(dǎo)航認知、路徑規(guī)劃一體化硬件測試,具有硬件體積小、功耗小等優(yōu)勢。
1.3 國內(nèi)外研究現(xiàn)狀總結(jié)
上述國內(nèi)外的研究工作動態(tài)為進一步深入開展基于類腦感知定位的無人機密集集群編隊協(xié)同導(dǎo)航研究提供了可借鑒的參考。但從上述國內(nèi)外的類腦集群編隊協(xié)同自主導(dǎo)航技術(shù)研究成果來看,大部分研究是對于無人機協(xié)同集群編隊中控制技術(shù)領(lǐng)域的探索,主要采用了慣性和 GPS 等導(dǎo)航技術(shù)實現(xiàn)集群編隊協(xié)同導(dǎo)航和控制; 在類腦導(dǎo)航方面,國內(nèi)外各研究者也正將類腦導(dǎo)航原理應(yīng)用到無人機、車輛導(dǎo)航中,但針對基于類腦感知定位的無人機密集集群編隊協(xié)同導(dǎo)航技術(shù)的研究還鮮有文獻報道,關(guān)于深度學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等人工智能方法的應(yīng)用也主要集中于單架無人機導(dǎo)航領(lǐng)域的內(nèi)容。
2 類腦感知定位機理及智能自適應(yīng)建模
2.1 類腦感知定位機理
大自然中動物導(dǎo)航感知的例子比比皆是,像人們熟知的GPS系統(tǒng)一樣,大腦定位系統(tǒng)也是通過自身的位姿信息、目標信息進行定位導(dǎo)航。生物腦中存在3種主要導(dǎo)航細胞位置細胞、頭朝向細胞及網(wǎng)格細胞。其中,海馬體中的位置細胞繪制所處地點的地圖; 頭朝向細胞指明方向( 將位置細胞和頭朝向細胞合并為一個新細胞類型,位姿細胞) ; 大腦內(nèi)嗅皮層中的網(wǎng)格細胞由位置細胞激活并通過標記被激活細胞的位置對環(huán)境進行重定位。此外,在內(nèi)嗅皮層還存在邊界細胞、條紋細胞、速度細胞等輔助導(dǎo)航定位的細胞。大腦通過感官從外界獲取環(huán)境中的特征信息,其中位置細胞能夠與海馬體中其他細胞合作,將輸入的特征信息與記憶的特征信息進行比對,如果信息匹配成功,與匹配位置對應(yīng)的特定位置細胞就會被激活。
2.2 群體動物感知定位機理
自然界中,鳥群編隊飛行的現(xiàn)象比較常見,其群聚行為包含自然社會、回避、探測以及防御掠奪等。鳥群經(jīng)常以“V”、“J”或梯形的線性編隊飛行,其中“J”形和 梯形編隊是“V”形編隊的變形,線性編隊行為可以通過鳥群成員間的視覺信息交互提高導(dǎo)航能力。
無人機編隊飛行形式與生物群體社會性行為存在相似性,通過研究生物群體行為規(guī)律,為無人機編隊飛行提供關(guān)鍵有效理論及技術(shù)思考,其中將生物集群編隊理論與無人機集群相對協(xié)同導(dǎo)航的研究在不斷推進。以鴿群為例,在導(dǎo)航方式方面,鴿子在旅程不同階段會使用不同導(dǎo)航工具,前期依賴地磁場判斷大致的方向,后期通過地標對實際方向進行修正,太陽高度也會影響鴿子導(dǎo)航。研究表明,鴿群編隊系統(tǒng)與狼群等 陸地群體的模式區(qū)別甚大,在鴿群中,所有的鴿子包括頭鴿及跟隨鴿都存在層次等級,區(qū)別是頭鴿的地位不容撼動,為群體的絕對領(lǐng)導(dǎo)者,跟隨鴿只能服從上層,跟隨鴿所受影響來自于頭鴿及其上層鴿,而來自于上層鴿的影響實時性更高、效果更強。
無人機編隊集群類腦導(dǎo)航的研究者從鴿群層級行為得到了很多啟發(fā),表現(xiàn)為:
1)鴿群編隊系統(tǒng)區(qū)別于陸地群體的單一首領(lǐng)制度。原因是視野及通訊最高距離的限制,鴿子只能與臨近上層的鴿子實時通訊并相對跟隨。無人機編隊類腦協(xié)同導(dǎo)航系統(tǒng)的研究受此啟發(fā),由于長機不能時刻在僚機的通訊及視野范圍內(nèi),采用長機與僚機通訊、僚機與僚機通訊的方式實現(xiàn)編隊飛行;
2)鴿群個體間不是任意兩鴿均可通訊聯(lián)系,而是具有森嚴制度。無人機編隊類腦協(xié)同導(dǎo)航系統(tǒng)的研究受此啟發(fā),采用類似等級制度,可以增強集群通訊的可靠性,即使出現(xiàn)干擾甚至故障,仍可迅速實現(xiàn)集群系統(tǒng)重構(gòu),使系統(tǒng)不受影響; 而且各無人機個體的通訊空間可大幅度減少。
2.3 類腦導(dǎo)航智能自適應(yīng)建模的發(fā)展現(xiàn)狀
未來類腦導(dǎo)航的主要發(fā)展趨勢之一是類腦認知,認知智能導(dǎo)航可以使智能導(dǎo)航系統(tǒng)進行理解與思考,在復(fù)雜環(huán)境下快速識別附近環(huán)境,自我判斷最優(yōu)路徑。典型例子有谷歌 DeepMind 的最新研究,其中文獻[8]說明了強化學(xué)習(xí)訓(xùn)練的深度神經(jīng)網(wǎng)絡(luò)在導(dǎo)航方面,仍不能與人腦的空間行為的熟練度相媲美的原因是缺乏內(nèi)嗅皮層網(wǎng)格細胞的支撐,網(wǎng)格細胞可以提供一個多維度周期表示基礎(chǔ),其作用類似于編碼空間,并且對于路徑集成( 集成自運動) 及計劃直接軌跡到目標( 基于矢量的導(dǎo)航) 有重要作用。實驗證明,網(wǎng)格單元自發(fā)地出現(xiàn)在神經(jīng)網(wǎng)絡(luò)中,使智能體獲得空間自導(dǎo)航能力,這與在哺乳動物中觀察到的神經(jīng)活動模式驚人的一致,也與網(wǎng)格細胞為空間提供高效代碼的觀點一致。
研究者首先利用網(wǎng)格細胞的計算功能設(shè)計一種類腦深度強化學(xué)習(xí)單元,訓(xùn)練一個具有長短期記憶 ( LSTM) 架構(gòu)的循環(huán)網(wǎng)絡(luò),使之出現(xiàn)類似于網(wǎng)格細胞的特征,以及其他內(nèi)嗅皮層細胞特征。速度作為輸入提供給該循環(huán)網(wǎng)絡(luò),該網(wǎng)絡(luò)隨時間的反向傳播進行訓(xùn)練,允許網(wǎng)絡(luò)動態(tài)地將當前輸入信號與反映過去事件的活動模式組合。正如預(yù)期的那樣,網(wǎng)絡(luò)能在涉及覓食行為的環(huán)境中準確進行路徑整合,其中25.2%的線性層單元類似于網(wǎng)格單元,在保守的場改組程序產(chǎn)生的零分布中表現(xiàn)出來顯著的六邊形活動模式,與嚙齒動物網(wǎng)格細胞的經(jīng)驗結(jié)果一致。線性層還表現(xiàn)出類似于頭部方向單元( 10.2%) ,邊界單元( 8.7% ) 和少量位置單元以及這些表示的連接單元。為了確定這些表示的穩(wěn)健性,文獻[5-6]表明對網(wǎng)絡(luò)進行了100次重新訓(xùn)練,每次都找到類似比例的網(wǎng)格狀單元( 平均23%, s.d.2.8% ,具有顯著網(wǎng)格特征的單元) 和其他空間調(diào)制單元。
為了開發(fā)具有矢量導(dǎo)航潛力的智能體,文獻[8]將上述“網(wǎng)格網(wǎng)絡(luò)”整合到一個用深度強化學(xué)習(xí)訓(xùn)練的更大的架構(gòu)中。和以前一樣,網(wǎng)格網(wǎng)絡(luò)是使用監(jiān)督學(xué)習(xí)訓(xùn)練的,如圖6所示,但為了更好地近似可用于導(dǎo)航哺乳動物的信息,它現(xiàn)在接收受隨機噪聲和視覺輸入擾動的速度信號。發(fā)現(xiàn)智能體能在有挑戰(zhàn)性的、不熟悉的、變化的環(huán)境中定位目標,具有類似于網(wǎng)格特征的智能體的性能超過了人類專家和其他對比個體,其基于矢量的導(dǎo)航所需的度量尺度來自于網(wǎng)絡(luò)中的網(wǎng)格狀單元。而且,網(wǎng)格細胞的特征使得智能體能夠執(zhí)行與哺乳動物類似的走捷徑的行為。研究結(jié)果表明,網(wǎng)格狀單元為個體提供了歐幾里德空間度量和相關(guān)的向量運算,為精確導(dǎo)航提供了基礎(chǔ)。因此,結(jié)果支持將網(wǎng)格單元視為基于矢量導(dǎo)航的關(guān)鍵的神經(jīng)科學(xué)理論,證明后者可以與基于路徑的策略相結(jié)合,以支持在具有挑戰(zhàn)性的環(huán)境中進行導(dǎo)航。
有監(jiān)督學(xué)習(xí)實驗中的網(wǎng)絡(luò)框架
網(wǎng)格單元的循環(huán)層是具有128個隱層單元的LSTM,該循環(huán)層的輸入為向量[v,sin(φ) ,cos(φ) ],初始時刻的地面真實位置,活動c0和頭朝向活動 h0 分別經(jīng)過線性變換后得到 LSTM的初始單元狀態(tài)和隱藏狀態(tài)的初始化值 l0和m0。LSTM的輸出是一個經(jīng)過正則化的線性層,該線性層的輸出gt是由線性變化得到的,并通過兩個softmax函數(shù)計算出預(yù)測的頭朝向單元活動zt和位置單元活動yt。研究表明線性層激活gt中含有網(wǎng)格狀單元及頭朝向狀單元。
傳統(tǒng)的同步定位與建圖(SLAM) 技術(shù)通常需要構(gòu)建準確且完整的地圖,從外部定義目標的性質(zhì)和位置。相比之下,文獻[8]中描述的深度強化學(xué)習(xí)方法能夠從稀疏獎勵中端到端地學(xué)習(xí)復(fù)雜的控制策略,以超過以往深度強化學(xué)習(xí)方法的自主能力直接引導(dǎo)個體到達目標甚至采用走捷徑的方式,而這些若在SLAM系統(tǒng)中則需要手動編碼。文獻[9]中提出了一種解決城市級現(xiàn)實環(huán)境中任務(wù)的深度強化學(xué)習(xí)導(dǎo)航方法,并分析了一項新的信使任務(wù),提出了一個多城市網(wǎng)絡(luò)智能體架構(gòu),演示了該如何將神經(jīng)網(wǎng)絡(luò)遷移到新的環(huán)境。
目前有4點需要進一步研究:
1) 如果神經(jīng)網(wǎng)絡(luò)的損失函數(shù)中不包括正則項,那么神經(jīng)網(wǎng)絡(luò)無法表現(xiàn)出網(wǎng)格細胞功能,這一發(fā)現(xiàn)給了我們一個全新的角度去思考正則項的作用;
2) 深度神經(jīng)網(wǎng)絡(luò)的黑盒特性阻礙了進一步分析網(wǎng)格細胞活動特性對路徑整合的作用,由于無法在模型內(nèi)進行原理分析、定性定量分析算法和編碼策略,使得研究網(wǎng)格細胞成為有效的導(dǎo)航方案異常困難,這一點再次強調(diào)了研究神經(jīng)網(wǎng)絡(luò)的必要性以及神經(jīng)科學(xué)家的重要性;
3) 還需要進一步分析深度學(xué)習(xí)系統(tǒng)的內(nèi)部工作機理,研究輔助類腦之空間導(dǎo)航的通用計算原理;
4) 目前只涉及了單個智能體的類腦導(dǎo)航,編隊類腦方面,只涉及到了與人工智能相關(guān)的導(dǎo)航,但離真正的類腦還是有一定距離。
3 類腦集群導(dǎo)航系統(tǒng)中面臨的重難點
國內(nèi)外研究者對無人機集群類腦導(dǎo)航系統(tǒng)開展了大量分析研究,針對目前存在的關(guān)鍵問題和發(fā)展趨勢,無人機編隊集群類腦導(dǎo)航系統(tǒng)的難點及重點主要是:
1)在密集編隊飛行應(yīng)用環(huán)境下,導(dǎo)航系統(tǒng)誤差傳播特性的變化對不同時空下的模型自適應(yīng)表達提出了新的要求,如何借鑒生物腦導(dǎo)航機理建立無人機類腦定位感知定位模型,以及對適應(yīng)密集集群編隊飛行環(huán)境的導(dǎo)航系統(tǒng)誤差建模這一問題亟待解決。
2) 密集集群編隊中的無人機飛行密度高,隊形控制復(fù)雜,對相對導(dǎo)航定位精度和魯棒性要求極高,因此需要解決密集集群飛行環(huán)境量測特征下基于類腦感知機理的相對導(dǎo)航信息融合方法。
3) 針對密集集群編隊對高可靠導(dǎo)航測量信息的要求,為確保無人機密集集群編隊導(dǎo)航系統(tǒng)對編隊無人機飛行狀態(tài)的可靠測量,必須解決在參考信息可用性變化的條件下,導(dǎo)航系統(tǒng)對故障信息的快速診斷和智能主動容錯的問題。
4) 在仿真驗證方面,實現(xiàn)從單機類腦到群體類腦的編隊導(dǎo)航仿真,及從簡單任務(wù)到復(fù)雜編隊任務(wù)場景的驗證。
4 結(jié)束語
類腦編隊導(dǎo)航是當前人工智能的研究熱點,但是我們必須認識到,當前我們對于大腦內(nèi)部功能的實現(xiàn)和大腦內(nèi)部神經(jīng)元細胞之間的信息傳遞機制等研究仍不夠深入,因此,要完全弄清類腦導(dǎo)航機理我們還有很多的工作要做。我們需要在已有認知機理的基礎(chǔ)上進行更深層次意義上的研究,并將相關(guān)成果應(yīng)用于類腦導(dǎo)航、醫(yī)學(xué)研究等意義重大。希望本文的綜述能為其他研究者豐富無人機編隊集群類腦導(dǎo)航理論及應(yīng)用時提供參考價值。
參考文獻
[1] 王偉,宋延華,馬浩等.旋轉(zhuǎn)翼無人機系統(tǒng)[J].控制工程,2015,22( 2) : 205-212.
[2] Woods J O,Christian J A. Lidar- based Relative Navigation with Respect to Non-cooperative Objects[J]. Acta Astronautica,2016,126: 298-311.
[3] Lee J Y,Kim H S,Choi K H,etal.Adaptive GPS/ INS Integration for Relative Navigation[J].GPSSolutions,2016,20 ( 1) : 63-75.
[4] 石鵬飛.無人機自主控制技術(shù)發(fā)展與挑戰(zhàn)[J].科技導(dǎo)報,2017(7) : 34-40.
[5] 牧彬,米征,盛凱等.BP神經(jīng)網(wǎng)絡(luò) PID 控制器在無人機編隊飛行中的應(yīng)用[J].測控技術(shù),2017,36( 4) : 66-69.
[6] 陳孟元.鼠類腦細胞導(dǎo)航機理的移動機器人仿生SLAM 綜述[J]. 智能系統(tǒng)學(xué)報,2018,13( 1) : 107 -117.
[7] 邱華鑫,段海濱,范彥銘.基于鴿群行為機制的多無人機自主編隊[J].控制理論與應(yīng)用,2015,32 ( 10) : 1298-1304.
[8]Banino A,Barry C,Uria B,etal.Vector- based Navigation using Grid-like Representations in Artificial Agents[J]. Nature,2018,557( 7705) :429-433.
[9]Piotr Mirowski,Matthew Koichi,Grimes Mateusz Malinowski.DeepMind 雙路徑智能體結(jié)構(gòu),不用地圖也能導(dǎo)航[J].機器人產(chǎn)業(yè),2018( 3) : 34-38.
[10]李升偉.人工智能模擬大腦導(dǎo)航密碼[J].世界科學(xué),2018( 9) : 25-6