“重感知”還是“重地圖”?特斯拉、毫末智行、華為都這樣選擇
【太平洋汽車網(wǎng) 行情頻道】2022年,自動駕駛的競爭毫無懸念的來到了乘用車輔助駕駛的規(guī)模之戰(zhàn)。圍繞這場大戰(zhàn),業(yè)內(nèi)已經(jīng)陷入到車上到底要搭載幾個激光雷達(dá)才能算高端的“內(nèi)卷之爭”。
商業(yè)的歸商業(yè),技術(shù)的歸技術(shù)。回到自動駕駛的技術(shù)發(fā)展路線上,我們還是要注意到行業(yè)的這樣一個趨勢,那就是自動駕駛的感知路線到底該怎么走?
很多行業(yè)人士可能注意到了,在今年4月由毫末智行舉辦的2022 HAOMO AI DAY上,在一如既往地對外進(jìn)行自動駕駛技術(shù)布道的豐富信息中,可以捕捉到一個非常明確的信號,那就是毫末智行在感知智能當(dāng)中對于“重感知”方案的重視。
具體來說,基于毫末智行數(shù)據(jù)智能體系MANA的HPilot 3.0會降低對高精地圖的依賴,即使在沒有高精地圖覆蓋的城市場景中,也能依靠強大的感知能力實現(xiàn)高級輔助駕駛。這就是所謂的“重感知”。
這是一個非常值得討論的變化。根據(jù)毫末智行CEO顧維灝的解釋,這是毫末智行對于自動駕駛第一性原理思考的一個結(jié)果——毫末智行自動駕駛的進(jìn)化更多依賴數(shù)據(jù)智能體系MANA的進(jìn)步,其中依賴視覺數(shù)據(jù)的感知智能的進(jìn)化是其關(guān)鍵。
那么,毫末智行這樣做的具體思考是什么呢?對于自動駕駛技術(shù)路線的發(fā)展有怎樣的借鑒意義呢?
自動駕駛的第一性原理:感知智能優(yōu)先
當(dāng)然,毫末智行并不是最先提出選擇“重感知”路線的自動駕駛企業(yè)。
眾所周知,特斯拉是第一家采用純視覺技術(shù)方案的自動駕駛企業(yè)。這一轉(zhuǎn)變從去年7月特斯拉發(fā)布FSD 9.0開始,同時特斯拉也推出了支持城市場景的高級輔助駕駛功能。
今年4月,海外一位特斯拉車主發(fā)布視頻,稱其在FSD的幫助下,實現(xiàn)了從洛杉磯開車到舊金山近600公里的零接管長途駕駛,場景包含城市、快速路與高速,一時間再次引起輿論對純視覺方案的關(guān)注。
除特斯拉與毫末智行外,華為也在近期談到了其對自動駕駛技術(shù)路線的思考。余承東在5月北汽極狐新車發(fā)布會上表示,華為ADS將加強對視覺傳感器的應(yīng)用,不過度依賴高精地圖,以快速實現(xiàn)對城市場景的覆蓋。
和毫末智行的城市NOH一樣,華為在北汽極狐阿爾法S華為HI版上也采用了高精地圖+激光雷達(dá)+攝像頭的多傳感器融合感知方案,但華為也強調(diào)會通過對高精地圖的主動“降權(quán)”,ADS可以在今年實現(xiàn)對城市場景的覆蓋。
頭部自動駕駛企業(yè)的快速轉(zhuǎn)變與發(fā)展,無疑對自動駕駛技術(shù)的發(fā)展方向帶來了強烈的沖擊,而這一切都源于其對第一性原理的剖析。
基于第一性原理我們可知,不論是漸進(jìn)式路線還是跨越式路線,自動駕駛的底層邏輯是不變的,即依靠AI在行駛過程中進(jìn)行視覺識別和判斷決策。
正如人類主要通過視覺感知世界、實現(xiàn)人工駕駛一樣,汽車也應(yīng)該依靠魯棒性更強的視覺進(jìn)行感知和判斷,實現(xiàn)自動駕駛。
人類通過不斷的觀察、學(xué)習(xí)、模仿與實踐,逐步實現(xiàn)由“新手司機”向“老司機”的蛻變,汽車也可以通過大規(guī)模真實與仿真道路數(shù)據(jù)的學(xué)習(xí)和訓(xùn)練,不斷迭代升級輔助駕駛的算法能力,逐步升級到自動駕駛。
在這一過程中,算力、算法與感知硬件的進(jìn)步為輔助,能夠為自動駕駛的到來提供加速。特斯拉、毫末智行、華為便是基于技術(shù)進(jìn)步快速實現(xiàn)了城市域高級輔助駕駛技術(shù)的規(guī)模化落地,但其核心依舊是數(shù)據(jù),數(shù)據(jù)才是建立并推動自動駕駛進(jìn)化的真正基石。
由此可見,當(dāng)下的自動駕駛技術(shù)發(fā)展正在處在關(guān)鍵抉擇期,而關(guān)鍵則是要從根源處找到獲取自動駕駛技術(shù)圣杯的金鑰匙。誰能夠率先認(rèn)識到并付諸實踐,誰就能在自動駕駛的下半場競爭中贏得為數(shù)不多的席位。
數(shù)據(jù)智能體系MANA驅(qū)動視覺感知進(jìn)化
毫末智行在僅僅2年多的時間便成為了乘用車輔助駕駛和末端物流自動配送車領(lǐng)域的領(lǐng)先者,其背后的邏輯正是源于對第一性原理的思考和應(yīng)用。
毫末智行CEO顧維灝認(rèn)為,算力、算法與感知硬件將隨著自動駕駛行業(yè)的快速發(fā)展迎來性能突破,而數(shù)據(jù)才是決定自動駕駛實現(xiàn)質(zhì)變的核心。
此外,毫末智行也認(rèn)識到,自動駕駛本質(zhì)上是對人工駕駛的效仿與超越,所以視覺感知能力的強大與否,將成為毫末能夠贏得自動駕駛下半場競爭的關(guān)鍵。
以數(shù)據(jù)智能體系MANA為全新基石假設(shè),毫末智行在2022 HAOMO AI DAY上推出了搭載城市NOH功能的HPilot 3.0;而作為HPilot 3.0的依托,MANA也在不到半年的時間內(nèi),完成了感知層面的進(jìn)化。
對于城市域高級輔助駕駛,毫末智行CEO顧維灝介紹,業(yè)內(nèi)存在兩個共同的難題,一個是對紅綠燈的識別與對應(yīng)的路口綁路,另一個則是對車道線的識別。
對紅綠燈識別的困難首先來自于全國紅綠燈標(biāo)準(zhǔn)的不統(tǒng)一。僅以倒計時來舉例,在北京,有的紅綠燈采用數(shù)字倒計時,有的完全沒有倒計時;而天津的紅綠燈則采用計時條倒計時。
同樣的問題還有紅綠燈與對應(yīng)路口的綁路。以保定三豐路、建國路與朝陽南大街交匯的“十字路口”為例,6個路口對應(yīng)6組紅綠燈,并且路口還分有主路與輔路,即使是真人司機也很難保證不走錯。
對此,MANA給出的解決方案是,采用毫末獨創(chuàng)的“雙流”感知模型,分兩步并同步處理紅綠燈識別與路口綁路,保證識別正確率與識別速度。
首先是紅綠燈識別問題。針對紅綠燈的不同形態(tài)與運行邏輯,MANA首先會從車主真實數(shù)據(jù)中進(jìn)行紅綠燈部分的篩選,并且也會在仿真系統(tǒng)中吸取經(jīng)過驗證的仿真數(shù)據(jù)。
與真實數(shù)據(jù)不同,仿真數(shù)據(jù)與其在真實世界中的映射終究會存在一定差異,所以MANA在這里又引入了混合遷移學(xué)習(xí)的概念,通過將兩種數(shù)據(jù)進(jìn)行混合與拉齊,實現(xiàn)對混合數(shù)據(jù)的高效應(yīng)用。
在正確識別紅綠燈的同時,MANA還要確認(rèn)與紅綠燈對應(yīng)的路口究竟是哪一個,而這正是Transformer的優(yōu)勢領(lǐng)域。
通過Transformer的全局注意力機制,MANA首先能夠搭建出一張解釋道路特征的Feature Map,通過其道路形狀、地圖導(dǎo)航等因素,判斷紅綠燈對應(yīng)路口的大致位置。
之后則是將其與紅綠燈識別結(jié)果進(jìn)行重合,最終得出“我要去哪一條路,那條路現(xiàn)在是紅燈還是綠燈”的結(jié)論。
當(dāng)前搭載L2級駕駛輔助系統(tǒng)的車輛都具備車道保持的功能,但在實際使用過程中,很多車都會出現(xiàn)車道內(nèi)左右橫擺的現(xiàn)象,其原因之一便來源于系統(tǒng)對車道線的識別邏輯。
此外,城市道路中很多車道線都存在新舊重疊、磨損褪色、中斷丟失、潮汐變更的問題,同樣也能夠?qū)φ嫒笋{駛帶來不小的迷惑,并導(dǎo)致輔助駕駛系統(tǒng)直接退出。
就像人低著頭走路遲早會撞墻一樣,傳統(tǒng)駕駛輔助系統(tǒng)之所以會經(jīng)常栽在車道線這一領(lǐng)域,很大原因在于其算法無法捕捉全局信息,僅能通過局部信息進(jìn)行決策。
此外,融合、糾正由攝像頭捕獲的車道線圖像,并基于這一信息進(jìn)行時序輸出,也是傳統(tǒng)輔助駕駛系統(tǒng)難以完善的,這同樣是導(dǎo)致很多自動駕駛企業(yè)依賴高精地圖的原因。
基于Transformer的全局注意力機制,MANA同樣可以輕松應(yīng)對這一難題。HPilot 3.0擁有6顆攝像頭,視角覆蓋車輛四周,而Transformer則可輕松將這6角信息進(jìn)行拼接,并在這一過程中消除傳感器本身存在的標(biāo)定誤差,拼接出連貫、真實的車道線。
此外,基于Transformer全局建模的能力也能讓MANA看得更遠(yuǎn),即使車道線出現(xiàn)磨損、丟失、位移等情況,MANA也能建立更準(zhǔn)確的道路拓?fù)渑c時序結(jié)構(gòu),提升系統(tǒng)魯棒性。
毫末智行的“重感知”方案為自動駕駛的發(fā)展帶了全新的認(rèn)知,但并不意味著毫末智行要徹底放棄高精地圖。根據(jù)2022 HAOMO AI DAY提供的信息,毫末智行城市NOH的路口通過率超過70%,變道成功率超過90%,交通流處理能力高達(dá)4級,并將在今年落地,但得益于“重感知”路線,城市NOH將是國內(nèi)第一個實現(xiàn)大規(guī)模量產(chǎn)的城市輔助駕駛產(chǎn)品,也將是國內(nèi)第一個最實用高效的城市輔助駕駛產(chǎn)品。
“重感知”趨勢下,自動駕駛開始“拼內(nèi)功”
不論業(yè)界對“重感知”評價如何,在以特斯拉、華為、毫末智行為代表的頭部自動駕駛企業(yè)的集體轉(zhuǎn)型下,自動駕駛未來將發(fā)展如何,已經(jīng)一目了然了——視覺感知將是自動駕駛企業(yè)建立優(yōu)勢地位的護(hù)城河,也將是實現(xiàn)自動駕駛的核心要義。
于自動駕駛而言,高精地圖、激光雷達(dá)就如兵器之于習(xí)武者,即使屬性再好,也終究是身外之物、不可過于依賴,何況好的兵器更需要好的內(nèi)功驅(qū)動;而視覺感知之于習(xí)武者,則是真正內(nèi)功的體現(xiàn)。習(xí)武者修煉好的內(nèi)功,不僅可以做到神形合一,也可以駕馭外界各種兵器,做到強強聯(lián)合、以一敵百。
在第一性原理的啟迪下,毫末智行在激進(jìn)的純視覺路線和保守的融合感知路線中正在探索一條更具優(yōu)勢的技術(shù)賽道,這為自動駕駛技術(shù)發(fā)展提供了一份非常好的參考模板。當(dāng)然,這也給自動駕駛下半場的群雄角逐提供了更多看點。
>>點擊查看今日優(yōu)惠<<


粵公網(wǎng)安備 44010602000157號