BEV感知引領(lǐng)輔助駕駛大混戰(zhàn),激光雷達(dá)終將走下神壇?
作者|孟祥威 來源|智造前研(ID:zhizao-qianyan)
短短一個(gè)多月的時(shí)間里,禾賽科技上市、蔚來 NOP+ 開啟公測(cè)、理想宣布切換融合感知框架、特斯拉在投資者日證實(shí) HW4.0 存在,輔助駕駛行業(yè)剛一開年就是“神仙打架”的狀態(tài),對(duì)于其他汽車廠商來說無疑非常頭大。2022 年,隨著國(guó)產(chǎn)激光雷達(dá)的大量出貨,讓很多技術(shù)積累不那么雄厚的企業(yè)剛剛摸上高階輔助駕駛的牌桌,現(xiàn)在椅子還沒坐熱呢,發(fā)現(xiàn)頭部企業(yè)已然悄悄統(tǒng)一技術(shù)路線進(jìn)入下一個(gè)維度的競(jìng)爭(zhēng)了。在車企爭(zhēng)相轉(zhuǎn)向 BEV 大模型感知路線的當(dāng)下,激光雷達(dá)還是自動(dòng)駕駛的香餑餑嗎?攝像頭又能否完成自我革命讓車輛感知能力再上一個(gè)臺(tái)階呢?
車載激光雷達(dá)可以通過計(jì)算激光到達(dá)被攝物體的時(shí)間精確判斷相對(duì)距離,并通過生成的點(diǎn)云對(duì)周圍環(huán)境成像。這種工作原理使激光雷達(dá)可以無視被攝物體的材質(zhì)、顏色以及環(huán)境明暗等外部因素,快速準(zhǔn)確的輸出結(jié)果,對(duì)于高速行駛的汽車來說至關(guān)重要。在所有前裝量產(chǎn)車市場(chǎng)里,除了業(yè)界鼻祖 Mobileye 和 不走尋常路的 Tesla 堅(jiān)定的選擇純視覺感知路線外,其他汽車廠商大多都會(huì)在高端車型中加入激光雷達(dá)用于輔助決策。
有了激光雷達(dá)的加入,車輛就能在夜間無照明路段或進(jìn)出隧道等大光比場(chǎng)景下及時(shí)發(fā)現(xiàn)前方障礙物并引導(dǎo)車輛躲避和制動(dòng),也能在高速巡航時(shí)對(duì)施工占道物體提前預(yù)警,這將大大提升車輛輔助駕駛過程中的安全性和舒適性。
當(dāng)然,任何技術(shù)都有優(yōu)劣勢(shì),激光雷達(dá)也不是無所不能的。首先就是極端天氣下無法工作,例如大霧、沙塵暴等非晴朗氣候條件下,紅外線透波率降低會(huì)導(dǎo)致激光雷達(dá)作用距離減小甚至完全無效。二是激光雷達(dá)無法感知色彩信息,對(duì)于交通信號(hào)燈和其他標(biāo)志的識(shí)別無能為力。三是對(duì)數(shù)據(jù)處理的需求較高,目前市面上主流的激光雷達(dá)出點(diǎn)數(shù)基本都在 150 萬/秒左右,既每秒能產(chǎn)生 150 萬個(gè)探測(cè)點(diǎn),且每個(gè)點(diǎn)具有獨(dú)立的三維坐標(biāo)信息,車載計(jì)算機(jī)必須在短時(shí)間內(nèi)進(jìn)行分析決策,這對(duì)車輛電子電氣架構(gòu)和硬件整合能力提出了更高的要求。最后就是老生常談的價(jià)格問題,雖然目前激光雷達(dá)的采購(gòu)價(jià)格已經(jīng)降低到萬元以內(nèi),甚至一些規(guī)格較低的能到千元級(jí),但有的產(chǎn)品動(dòng)輒配置兩個(gè)甚至四個(gè)激光雷達(dá),整體成本的提升對(duì)消費(fèi)者來說仍有較大壓力,與白菜價(jià)的攝像頭相比更是天壤之別。
對(duì)于車企來說,在軟件實(shí)力和數(shù)據(jù)積累比較薄弱的情況下,采用激光雷達(dá)方案可以通過少量的資金投入快速提高自身輔助駕駛系統(tǒng)的可用程度,搶占市場(chǎng)份額以獲取更高的主動(dòng)權(quán)。
當(dāng)然不是,我們知道攝像頭獲取的圖像是 2D 數(shù)據(jù),信息豐富程度是夠了,但是很難對(duì)深度信息和速度做出準(zhǔn)確判斷,而激光雷達(dá)獲取的是 3D 數(shù)據(jù),這恰恰是它最擅長(zhǎng)的地方。如何才能把攝像頭產(chǎn)生的 2D 畫面與激光雷達(dá)產(chǎn)生的 3D 畫面準(zhǔn)確的映射在一起,就成了自動(dòng)駕駛開發(fā)中的關(guān)鍵問題。
在傳統(tǒng)的開發(fā)模式中,每個(gè)傳感器互相獨(dú)立,前向主視覺攝像頭依然在環(huán)境感知和決策中占據(jù)主導(dǎo)地位,其他設(shè)備更多的是起到對(duì)數(shù)據(jù)交叉驗(yàn)證的作用,無法深度參與到整個(gè)規(guī)控流程。這種情況下,即便是激光雷達(dá),也很難發(fā)揮其優(yōu)勢(shì),只能在 AEB 主動(dòng)緊急制動(dòng)等少數(shù)場(chǎng)景做針對(duì)性的優(yōu)化,大多數(shù)場(chǎng)景下與未搭載激光雷達(dá)的車型沒有體驗(yàn)上的差距。更尷尬的是,一旦各個(gè)傳感器得到的數(shù)據(jù)出現(xiàn)較大的誤差,那么分析決策的過程就會(huì)變的混亂且低效。
為了解決多傳感器數(shù)據(jù)融合判斷的難題,Tesla 自 2021 年起在全新的 FSD beta 版本中,引入了 BEV 技術(shù)進(jìn)行環(huán)境感知。BEV 全稱 Bird’s eye view,也就是鳥瞰圖,BEV 感知算法的本質(zhì)是多傳感器融合背景下的一種視角表達(dá)形式,可以使多個(gè)傳感器數(shù)據(jù)在相同視角下表達(dá)。
通過改進(jìn)版的 Transformer 模型,Tesla 對(duì)全車 8 個(gè)攝像頭的畫面進(jìn)行坐標(biāo)轉(zhuǎn)換,并放置在同一個(gè)坐標(biāo)系中(BEV 空間),這樣就可以形成一個(gè)虛擬的向量空間。后續(xù)所有的分析和決策都在這個(gè)空間中進(jìn)行,當(dāng)所有的傳感器都用同一種語(yǔ)言的時(shí)候,溝通就變得更方便了。由于坐標(biāo)系相同,在這個(gè)空間中圖像數(shù)據(jù)、毫米波雷達(dá)數(shù)據(jù)、激光雷達(dá)數(shù)據(jù)、高精地圖數(shù)據(jù)都可以進(jìn)行融合。
BEV 大模型對(duì)車輛感知能力的提升使之成為兵家必爭(zhēng)之地,理想汽車在 L7 的新品發(fā)布會(huì)上提到了智能駕駛方面的最新進(jìn)展:全面切換到與清華大學(xué)聯(lián)合開發(fā)的混合 BEV 框架,并實(shí)現(xiàn)了不同傳感器類型的“可插拔”,使得一套算法同時(shí)兼容純視覺感知和激光雷達(dá)增強(qiáng)感知;蔚來也在全新 NOP+ 開放測(cè)試時(shí)表示將在 2023 年上半年完成向 BEV 感知路線的切換,小鵬、毫末智行、百度Apollo 等廠商也先后分享了自家基于 BEV 的新一代感知架構(gòu)的最新進(jìn)展,目前,不管是理想 AD Max,蔚來 NOP+還是小鵬 NGP,感知能力和邊界都較上一代產(chǎn)品有了大幅度提升,決策和規(guī)控也更加成熟,隨著研發(fā)人員對(duì)人工智能模型和計(jì)算機(jī)視覺理解的進(jìn)一步深入,等 BEV 算法正式推送到用戶手中的時(shí)候,領(lǐng)航輔助駕駛產(chǎn)品才算到達(dá)歷史上的“iPhone 節(jié)點(diǎn)”,完成了從能用到好用的跨越。
當(dāng)各大廠商通過 BEV 更好的識(shí)別周圍車輛和行人之后,新的問題也隨之出現(xiàn)了。
我們知道,汽車如果想要感知周圍環(huán)境除了要“看得見”還要“認(rèn)得清”,這就需要開發(fā)階段對(duì)交通參與者進(jìn)行標(biāo)注,幫助汽車逐漸認(rèn)識(shí)什么是轎車、卡車、行人、自行車,也就是所謂的白名單機(jī)制。但是,實(shí)際的道路環(huán)境非常復(fù)雜,掉落的石塊、狂風(fēng)折斷的樹木、違規(guī)占道停放的車輛等等,廠家不可能提前標(biāo)注好所有可能出現(xiàn)在路上的物體,當(dāng)車輛遇到白名單中不存在的物體時(shí),大概率會(huì)直接忽略從而無法做出反應(yīng),早些年自動(dòng)巡航狀態(tài)下的車輛撞上高速公路施工設(shè)施就是這個(gè)原因。
為了解決“一般障礙物感知與規(guī)控”問題,國(guó)內(nèi)廠商的做法就是加裝激光雷達(dá),通過激光點(diǎn)云判斷未知障礙物的體積,再結(jié)合高精地圖數(shù)據(jù)選擇制動(dòng)或者變道繞行;而高精地圖數(shù)據(jù)的及時(shí)性和準(zhǔn)確性又直接決定了整套系統(tǒng)的可用程度,當(dāng)前市面上所有已交付的高速導(dǎo)航輔助駕駛系統(tǒng),在遇到高精地圖與實(shí)際道路不符的情況時(shí)都會(huì)直接降級(jí)退出,如果車輛不能擺脫對(duì)高精地圖的依賴,那城市道路導(dǎo)航輔助駕駛就幾乎不可能實(shí)現(xiàn)。
對(duì)于面向全球市場(chǎng)發(fā)售的 Tesla 來說,獲取發(fā)售國(guó)家所有城市的高精地圖是不現(xiàn)實(shí)的,即便是國(guó)內(nèi)廠商,高精地圖覆蓋范圍也小的可憐。為此,馬斯克破釜沉舟的選擇了完全使用攝像頭感知標(biāo)注道路標(biāo)線,完全使用攝像頭生成虛擬點(diǎn)云取代激光雷達(dá)的方案,統(tǒng)稱“Tesla Vision”。在 2022 年的 AI Day 上,他們介紹了 BEV 進(jìn)化后的算法網(wǎng)絡(luò)——Occupancy Network 占用網(wǎng)絡(luò)。
搞清楚啥是占用網(wǎng)絡(luò)之前,先來看看效果吧。
它能在 10 毫秒內(nèi)向車載計(jì)算機(jī)輸出車輛周圍每個(gè) 3D 位置的占用概率,并能夠預(yù)測(cè)被瞬時(shí)遮擋的障礙物。同時(shí)它還會(huì)標(biāo)注畫面中出現(xiàn)的物體語(yǔ)義并用顏色區(qū)分,例如:路邊的汽車、永久性障礙物或低小碎片等并劃分當(dāng)前“可安全行駛區(qū)域”,也就是上圖中藍(lán)紫色框線的部分,由下游決策系統(tǒng)在框線范圍內(nèi)自由選擇行進(jìn)路線。
由于占用網(wǎng)絡(luò)將現(xiàn)實(shí)世界分割成了一個(gè)個(gè)小方塊,從而跳出了物體識(shí)別的固有思維,所以不管畫面中出現(xiàn)的是什么、體型多么怪異又是否處在運(yùn)動(dòng)過程中,車輛都可以快速準(zhǔn)確的做出判斷。
這是一輛正在起步出站的加長(zhǎng)公交車,可以看到在占用網(wǎng)絡(luò)的視角中精準(zhǔn)預(yù)測(cè)了其前半段車廂為運(yùn)動(dòng)狀態(tài)(藍(lán)色標(biāo)識(shí)),后半段車廂為靜止?fàn)顟B(tài)(紅色標(biāo)識(shí)),隨著公交車速度的增加后半段車廂會(huì)逐步變藍(lán)直到整節(jié)車輛都被標(biāo)識(shí)為運(yùn)動(dòng)物體。在其他的演示案例中,這套模型對(duì)于卡車和拖掛房車等特殊車輛判斷都有良好的適應(yīng)性。
可以看到,在多種深度學(xué)習(xí)模型的加持下,僅有 144 TOPS 算力和 8 顆環(huán)視攝像頭的 Model 3 擁有了比肩激光雷達(dá)的探測(cè)能力,配合全自動(dòng) 4D 標(biāo)注技術(shù) Model 3 可以在車機(jī)端完成當(dāng)前道路高精地圖的實(shí)時(shí)繪制,如果說 BEV 感知讓汽車邁過了自動(dòng)駕駛的門檻的話,那么占用網(wǎng)絡(luò)顯然直接把自動(dòng)駕駛的大門砸開了,當(dāng)然,如此恐怖的態(tài)勢(shì)感知能力也使得 FSD 引進(jìn)國(guó)內(nèi)市場(chǎng)變得愈加艱難。
既然純視覺方案完全可以滿足車輛對(duì)于自動(dòng)駕駛的需求,那么激光雷達(dá)的市場(chǎng)會(huì)不會(huì)逐步萎縮呢?
還在糾結(jié)這個(gè)問題的人顯然沒搞清楚激光雷達(dá)的對(duì)手到底是誰,攝像頭從來都不是,甚至任何其他的傳感器之間也完全沒有競(jìng)爭(zhēng)關(guān)系,真正決定硬件去留的,是軟件的能力邊界;而軟件的能力邊界背后是數(shù)據(jù)、算力和資金持續(xù)不斷地投入。
李想本人在春季媒體溝通會(huì)上非常坦誠(chéng)的表示,要做基于 BEV 的城市 NOA,基本上要 20 億美金起步。必須保證可以持續(xù)創(chuàng)造健康的收入、健康的毛利來供給模型的迭代,很多公司做著做著就投不起了。
顯然并不是所有玩家都可以玩轉(zhuǎn)城市 NOA 的,隨著供應(yīng)鏈的成熟,激光雷達(dá)采購(gòu)價(jià)格肯定會(huì)進(jìn)進(jìn)一步走低,對(duì)于一些中低端車型來說,搭配較為基礎(chǔ)的算法僅實(shí)現(xiàn)高可用度的高速 NOA也是一個(gè)不錯(cuò)的選擇。而一線的頭部品牌在精進(jìn)軟件能力后,也可以選擇放棄車頂?shù)闹骷す饫走_(dá),僅使用小型激光雷達(dá)用作補(bǔ)充,進(jìn)一步優(yōu)化凸出的雷達(dá)對(duì)車輛外觀的影響。
總之,是否采用激光雷達(dá)完全取決于企業(yè)的軟件研發(fā)與成本控制策略,未來如果遇到攝像頭無法解決的問題,那么不管 Tesla 把什么類型的傳感器再加回來我都不會(huì)奇怪。
編者按:本文轉(zhuǎn)載自微信公眾號(hào):智造前研(ID:zhizao-qianyan),作者:孟祥威
前瞻經(jīng)濟(jì)學(xué)人
專注于中國(guó)各行業(yè)市場(chǎng)分析、未來發(fā)展趨勢(shì)等。掃一掃立即關(guān)注。