曠視開啟自動駕駛落地!千元成本,純視覺小算力大能力
賈浩楠 發(fā)自 副駕寺智能車參考 | 公眾號 AI4Auto
智能汽車領(lǐng)域,一個AI行業(yè)的big name殺進(jìn)場。交出了這樣的智能駕駛量產(chǎn)方案:
視覺為主,全棧算法自研,成本千元級別。
最驚奇的是,僅僅用現(xiàn)在主流方案1/6-1/5的算力,跑通BEV+Transformer的大規(guī)模感知模型。而這,正是目前競爭最激烈的城市、高速NOA功能實現(xiàn)的基礎(chǔ)。
(資料圖片僅供參考)
而且已經(jīng)進(jìn)入車企定點名單,明年上半年就能量產(chǎn)上車。
該團(tuán)隊透露,智能車項目自啟動,不過做了2年多時間,卻追趕了行業(yè)平均5-6年的進(jìn)度。
智能車賽道這位“亮相即交卷”的闖入者,是AI明星公司、全球計算機(jī)視覺最強(qiáng)玩家之一的——曠視科技。
成立十二年,計算機(jī)視覺算法能力已臻化境,并開拓了城市、消費、供應(yīng)鏈等業(yè)務(wù)場景,還早已實現(xiàn)規(guī)?;癄I收。
但智能車業(yè)務(wù),之前曠視低調(diào)十足,不為外人道。
為什么現(xiàn)在亮相?怎么做智能汽車?有什么獨特優(yōu)勢?最重要的,車企買帳嗎?
現(xiàn)在,一系列疑問都可以直接找曠視專門負(fù)責(zé)自動駕駛的業(yè)務(wù)高管談。
曠視拿出了什么樣的智能車方案
曠視拿出的方案不是技術(shù)演示,也不是“高舉高打”的高階自動駕駛降維技術(shù)體系,而是極其務(wù)實、強(qiáng)調(diào)量產(chǎn)和規(guī)?;妮o助駕駛方案。
根據(jù)傳感器配置、算力大小分為三個。
標(biāo)準(zhǔn)版方案,滿足基礎(chǔ)、高頻使用智能駕駛場景,功能包括L2全家桶。亮點之處在于它的上限:標(biāo)配自主泊車、記憶泊車,以及高速高架NOP功能。
所謂NOP,就是行業(yè)內(nèi)常說的領(lǐng)航輔助駕駛,通常叫法是NOA。NOA開啟時,用戶僅需作為安全員,車輛全部駕駛?cè)蝿?wù)由系統(tǒng)完成,并且能根據(jù)地圖導(dǎo)航信息自行選擇路線、車道和行進(jìn)策略。
標(biāo)準(zhǔn)版方案面向10-15萬元車型,這也是曠視智駕方案的第一個特征,就是將“入門版智駕”門檻拉的極高,15萬左右的經(jīng)濟(jì)性家用車,高速NOP起步,以及增添了記憶泊車功能。
專業(yè)版方案,在標(biāo)準(zhǔn)版上,增加城市NOP功能,以及跨車道安全停車。面向15-30萬車型。
以上兩個方案,都是沒有激光雷達(dá)的,視覺為主+毫米波雷達(dá)。
最后還有一款面向30萬以上車型的旗艦版方案,官方描述為“更多的冗余”,實現(xiàn)“增強(qiáng)城市NOP”功能。
不出意外的話,更多冗余代表著更大的算力,比如英偉達(dá)Orin,以及激光雷達(dá)。
曠視高級副總裁,自動駕駛業(yè)務(wù)負(fù)責(zé)人劉偉透露,標(biāo)準(zhǔn)版和專業(yè)版是目前商業(yè)上主推的兩個方案,幾乎覆蓋乘用車銷售的絕大部分車型。
曠視的方案可以算是行業(yè)內(nèi)首個實現(xiàn)“低算力、高功能”的。并且還有一個“行業(yè)首次”:入門即標(biāo)配高速NOP。
按照以往的固有思路,要實現(xiàn)某一程度的智能駕駛功能,就必須有足夠多的傳感器冗余,以及足夠大的算力支撐。
比如L2+階段,至少需要數(shù)百TOPS算力,以及激光雷達(dá)+毫米波雷達(dá)+攝像頭的傳感器方案,L4則至少需要1000TOPS。
但也有一個現(xiàn)象是,堆到1000TOPS算力的量產(chǎn)車,其功能體驗也沒有超出L2范圍。
這是不是意味著,智能駕駛類似ChatGPT這樣“大力出奇跡”的轉(zhuǎn)折點仍未到來,現(xiàn)階段要實現(xiàn)智能駕駛的規(guī)?;占昂徒当荆八惴ㄉ暇?xì)作+盡量榨干硬件潛力”才是更符合技術(shù)發(fā)展規(guī)律和商業(yè)邏輯的道路?
所以曠視智能駕駛方案走了一條極致性價比的道路,在智能駕駛套件中,把相同技術(shù)指標(biāo)要求的硬件成本,降到前所未有的低。
橫向比較來看,曠視標(biāo)準(zhǔn)版方案,據(jù)官方介紹僅需主流英偉達(dá)Orin 1/5,甚至1/6的算力(大約40-50TOPS),就能實現(xiàn)高速NOP功能。
而目前大部分量產(chǎn)智駕方案,至少需要一整塊Orin(254TOPS)作為主系統(tǒng)和冗余的算力支持。
這樣一來,曠視在面向售價為10-15萬元的車型上,就能靈活搭配成本低得多的英偉達(dá)Orin N、地平線J5、黑芝麻A1000等等產(chǎn)品,車企完全能接受。
這屬于在底層計算平臺上降本。
還有一個特點就是“視覺為主,無激光雷達(dá)”。屬于在上層傳感器層面降低成本,而且降本的主力。
如何實現(xiàn)低算力高功能
技術(shù)上來看,曠視實現(xiàn)“極致性價比”的核心原因在于算法、算力,以及工具鏈的積累。
原創(chuàng)算法,這是曠視的技術(shù)底座。以視覺為主,采取“BEV+前融合”的方案,砍掉激光雷達(dá),減少對毫米波雷達(dá)的使用。但以視覺為主的技術(shù)路線,對感知識別算法要求極高。
曠視對BEV有兩個實現(xiàn)的算法模型,一個是BEVDepth系列,一個是PETR系列,都是曠視研究院提出的視覺3D感知模型。
PETR框架能同時進(jìn)行3D目標(biāo)檢測、BEV(Bird’s Eye View,鳥瞰圖)分割和3D車道線檢測等多項感知任務(wù),引入3D position embeding(3維位置映射),實現(xiàn)不依賴于BEV特征的時序?qū)R并支持BEV分割,避免了BEV可能的信息損失。
BEVDepth是一種帶有顯式深度監(jiān)督的多視圖 3D 目標(biāo)檢測新網(wǎng)絡(luò),利用編碼的內(nèi)在和外在參數(shù)獲得明確的深度監(jiān)督,并進(jìn)一步引入了深度校正子網(wǎng)絡(luò)來抵消由投影引起的干擾。
如果有些芯片對于Transformer的算子支持不太好可以采用BEVDepth;如果對于Transformer的算子支持非常好,那采用PETR。
BEV+Transformer架構(gòu)最早由特斯拉在2020年引入。不過不同于特斯拉占用網(wǎng)絡(luò)采用的稠密算法,曠視的PETR系列在輸出對周圍環(huán)境的各種感知表征時,采用的是稀疏算法。
用稀疏的方式來做Transformer,同樣能非常好地檢測到長尾場景中的障礙物,同時還對算力要求更低,低算力高功能的核心就是這項技術(shù)。
除了這兩個核心算法,曠視還有基于物體點解決漏標(biāo)和多標(biāo)等問題的半監(jiān)督檢測算法 PointDETR、一個錨點檢測多個物體,性能全面超越主流DETR目標(biāo)檢測器AnchorDETR等等。
算力基礎(chǔ)設(shè)施,曠視到目前為止,已經(jīng)構(gòu)建了一萬多張卡的計算集群,快速迭代能力同樣是大模型實力的基礎(chǔ)。
另一方面,為了降本,曠視還對“統(tǒng)一算法框架”做了大量工作。
一般而言,從旗艦車型到入門級車型,一家主機(jī)廠每種車型采用的配置方案都各不相同,供應(yīng)商方案相當(dāng)復(fù)雜,這導(dǎo)致車輛在推出量產(chǎn)時,無論是把握節(jié)奏、質(zhì)量、成本,還是管理和維護(hù)不同供應(yīng)商,都很難控制。
曠視在做的,把適配各種定位車型的智能駕駛系統(tǒng),都采用統(tǒng)一的BEV算法框架,做到算法平臺化、硬件平臺化。比如在適配高中低不同算力的芯片時,曠視采用Pin-to-Pin的系列芯片,即同一套域控可以直接適配不同芯片硬件,如果域控需要適配高算力芯片,就換高算力芯片,如果要適配低算力芯片,就換一個低算力的芯片。
做到這一點后,主機(jī)廠各個車型的量產(chǎn)速度將大大加快,質(zhì)量更好的同時,成本也將大幅降低。
在硬件配置方面,曠視則堅持走以視覺為主的感知路徑,支持采用實時建圖的感知方式,只用導(dǎo)航地圖,不用高精地圖。
除此之外,曠視還能做到直接去掉RTK(實時差分定位,高精度測量方法)。去掉這兩項,每套套件又能節(jié)省數(shù)百元的費用。
總計一下,曠視智駕方案的技術(shù)特征或比較優(yōu)勢,有以下這些:
業(yè)內(nèi)首個實現(xiàn)長達(dá)300米距離視覺感知。
業(yè)內(nèi)首個將 [BEV+Transformer] 感知算法模型,運行在低算力芯片平臺。
業(yè)內(nèi)首創(chuàng)魚眼BEV模型,感知范圍擴(kuò)大三倍。基于BEV+Transformer] ,在泊車場景下車位的感知距離可達(dá)30米(傳統(tǒng)方案支持約8米左右),3D感知定位能力接近激光雷達(dá)。
支持3D地圖構(gòu)建,不依賴于高精地圖便可實現(xiàn)高速和城區(qū)NOP去RTK定位算法,定位能力達(dá)到RTK方案水平。
端到端Transformer大模型進(jìn)展迅速,已經(jīng)在Orin平臺實現(xiàn)感知、建圖、跟蹤、預(yù)測4合一模型。
除了智能駕駛,曠視在智能座艙領(lǐng)域也開始了布局。相關(guān)的技術(shù),依托12年技術(shù)研發(fā),早已有積累。
目前的狀態(tài)是和主機(jī)廠協(xié)商,瞄準(zhǔn)下一代智能座艙產(chǎn)品進(jìn)行預(yù)研。
比如,曠視認(rèn)為智能座艙會成為大模型落地的重要場景。這首先會帶來感知能力的進(jìn)一步提升。但落到產(chǎn)品體驗層面,更重要的還是決策。
比如智能汽車的底盤、空氣懸掛、剎車系統(tǒng)、車窗、燈光氛圍,幾乎所有東西能被控制。但是,這么多東西都用觸摸屏、語音的方式進(jìn)行交互嗎?顯然不可能。
曠視基于AI生產(chǎn)力平臺Brain++的能力,未來會聚焦于智能座艙的決策引擎。同時,結(jié)合在芯片、軟件算法方面的能力,形成覆蓋感-知-決的智能座艙產(chǎn)品體系。
而在基礎(chǔ)的在“感”和“知”上面,曠視目前已經(jīng)擁有相對成熟的產(chǎn)品積累。例如IMS雙光融合傳感器,以及在“知”上面的DMS/OMS SDK等。
曠視做智能汽車的邏輯
智能汽車賽道之所以火熱,是因為智能汽車本身就是AI能力的綜合載體,又是一個融合了汽車工業(yè)和科技產(chǎn)業(yè),“含金量”無法估量的大賽道。
這是不能錯過的商業(yè)前景。有實力的AI玩家,幾乎都時不我待的投身其中。
另一方面,無論智能駕駛和智能座艙,計算機(jī)視覺技術(shù)都是重要基座。
2006年Hinton提出深度學(xué)習(xí)。包括曠視在內(nèi)的第一批AI創(chuàng)業(yè)公司,都敏銳地抓住了深度學(xué)習(xí)和計算機(jī)視覺技術(shù)結(jié)合帶來的機(jī)會,并為它們找到了合適的落地場景。
比如曠視的三大業(yè)務(wù)場景:消費、城市、供應(yīng)鏈。這些業(yè)務(wù)成了曠視成為平臺型AI“巨頭”的支柱,計算機(jī)視覺技術(shù)也成為了曠視自身優(yōu)勢的來源。
所以,于時勢、于商業(yè)、于技術(shù),曠視入局智能車,只是個早晚問題。
一直在等待的,是合適的時機(jī)和人選。
從早期的輔助駕駛技術(shù)開始,主流的技術(shù)路線一直是“雷達(dá)+視覺”。
而且因為早期深度學(xué)習(xí)算法還不成熟,彼時視覺數(shù)據(jù)只是作為輔助,智能駕駛絕大部分功能,依賴毫米波雷達(dá)。
但毫米波雷達(dá)本身存在局限:精度有限、缺失物體高度信息,以及最致命的,是對靜止物體感知不佳。
所以曠視認(rèn)為,基于RV(雷達(dá)+視覺)的傳統(tǒng)算法,是不可能解決高階智能駕駛問題的,而自己的優(yōu)勢又集中在計算機(jī)視覺算法,因此一直選擇觀望,等待一個技術(shù)層面的突破。
直到2020年,特斯拉首次提出BEV算法,并且成功用8個攝像頭的數(shù)據(jù)實現(xiàn)了NOA功能的演示,純視覺路線的一扇窗突然被打開。
BEV+Transformer的技術(shù)路線,跟曠視長處完美結(jié)合,于是開始迅速跟進(jìn)。并且明確以商業(yè)化落地為目標(biāo)確定研發(fā)方向:
同時為了支持智能車業(yè)務(wù),曠視組建了一支數(shù)百人的團(tuán)隊,其中超過2/3是研發(fā)人員。
帶領(lǐng)這支隊伍的關(guān)鍵人物劉偉,曾擔(dān)任SAP全球副總裁,微軟渠道事業(yè)部總經(jīng)理。有消費電子、車載AI方案、智能傳感器、計算芯片等領(lǐng)域豐富的落地經(jīng)驗。
這也符合曠視一直以來具體業(yè)務(wù)落地的風(fēng)格——尋找一個有行業(yè)背景或商業(yè)化knowhow的高管。
所以曠視進(jìn)軍智能車業(yè)務(wù)的邏輯,可以簡單總結(jié)為這樣的一句話:
這件事有前景,自身技術(shù)實力又有積累,現(xiàn)在產(chǎn)業(yè)鏈條件剛好又足以支撐“極致性價比”的產(chǎn)品策略。
智能車業(yè)務(wù)亮相,重估曠視
曠視智能車業(yè)務(wù)亮相,對于這個行業(yè)來說是一個明顯的轉(zhuǎn)折點。
從透露的智駕方案配置來說,曠視首次把高階智駕功能,標(biāo)配給10-15萬入門車型。
這是全球智能汽車產(chǎn)業(yè)L2+功能普及的開端,也是汽車工業(yè)智能化革命更加深化的標(biāo)志。
另外,曠視將高階智駕門檻降得前所未有的低,性價比做的前所未有的高,以及把這條賽道的技術(shù)天花板,拉的史無前例的高。
這意味著,一輪更加劇烈的行業(yè)內(nèi)卷已經(jīng)開始。
有利于技術(shù)迭代推陳出新,有利于用戶消費體驗。
而對于曠視自身的發(fā)展來說,進(jìn)軍智能車,也釋放了新的信號。
曠視在過去,一直聚焦在AIoT領(lǐng)域。在消費物聯(lián)網(wǎng)、城市物聯(lián)網(wǎng)和供應(yīng)鏈物聯(lián)網(wǎng)三大場景展開落地。
這些業(yè)務(wù)場景,都以計算機(jī)視覺技術(shù)作為依托,這也是曠視創(chuàng)業(yè)的根基。
而在12年之間,曠視除了在算法層面深耕,更重要的的是積累了AI生產(chǎn)工具和“方法論”,實現(xiàn)快速生產(chǎn)、敏捷開發(fā)。
這是一種更廣義的AI技術(shù)“泛化”能力,即把相同的算法軟件框架,快速應(yīng)用到不同的場景、行業(yè)和產(chǎn)品形態(tài)上。
不一定是簡單的核心算法通用,更重要的是算法生產(chǎn)工具,平臺工具鏈發(fā)揮作用。
所以理解曠視入局智能車,不能簡單的把它作為一個智能駕駛技術(shù)供應(yīng)商,而應(yīng)該縱向連接起它的歷史——
曠視一直是一個以算法為基礎(chǔ),軟硬一體為核心的智能機(jī)器人公司。
智能汽車,是一個控制維度最少(橫縱兩向),目前產(chǎn)業(yè)化最成熟的“機(jī)器人”罷了。
事實上,曠視、大疆、商湯這類“平臺型”AI公司,業(yè)務(wù)順理成章延伸到智能汽車,也是某種意義上AGI的萌芽和開端。
曠視科技,毫無疑問是中國乃至全球最具價值的AI視覺公司之一。
而現(xiàn)在,加上自動駕駛場景,智能車業(yè)務(wù)……曠視,到了該被重估的時候。
—聯(lián)系作者—
—完—
【智能車參考】原創(chuàng)內(nèi)容,未經(jīng)賬號授權(quán),禁止隨意轉(zhuǎn)載。
點這里關(guān)注我,記得標(biāo)星,么么噠~
關(guān)鍵詞:
[責(zé)任編輯:xwzkw]
相關(guān)閱讀
- (2023-08-26)曠視開啟自動駕駛落地!千元成本,純視覺小算力大能力
- (2023-08-26)《鐵拳8》Steam預(yù)購開啟 標(biāo)準(zhǔn)版348元、終極版548元
- (2023-08-26)各地啟動開學(xué)軍訓(xùn) 龍角散等護(hù)嗓產(chǎn)品走熱 具體是什么情況?
- (2023-08-26)珠海新盤“打五折”?住建部門:項目采取的降價推盤做法為合理的市場行為
- (2023-08-26)同是藍(lán)臺主持人卻口碑不同,華少、朱丹、沈濤,他們的差別在哪?
- (2023-08-26)"用母愛教育助力家庭教育,用鄉(xiāng)村教育助力鄉(xiāng)村振興"主題走訪調(diào)研活動圓滿結(jié)束
- (2023-08-26)黑河不斷培育養(yǎng)老服務(wù)新業(yè)態(tài) 打造夏季康養(yǎng)旅居最佳棲息地
- (2023-08-26)澳門今起禁止日本部分地區(qū)水產(chǎn)品等物品的進(jìn)口
- (2023-08-26)吉首大學(xué)舞蹈專業(yè)怎么樣?
- (2023-08-26)cisco交換機(jī)故障問題分析 思科交換機(jī)故障排查
- (2023-08-26)存量房貸利率下調(diào)進(jìn)展到哪了?2家銀行首次公開回應(yīng)
- (2023-08-26)熱門車訊廣汽傳祺GS5將于4月上市 預(yù)售15萬左右
- (2023-08-26)俞敏洪想做線上山姆,東方甄選帶貨賣了100億元,淘寶40萬粉絲蹲守等首播
- (2023-08-26)描寫下雨的詩詞句有哪些 描寫 ldquo 下雨天 rdquo 的詩句有哪些
- (2023-08-26)寧王英雄杯永恩0-3開局殺到10-3:我這永恩師承小虎 牛不牛!
- (2023-08-26)楊超越新劇撲得太慘,曝楊冪《狐妖小紅娘》成恒星引力救命稻草
- (2023-08-26)亦莊開零售首店有望獲250萬支持,米其林三星獎80萬
- (2023-08-26)Tech Insights:Q2全球折疊屏手機(jī)出貨量同比增長24%
- (2023-08-26)明年發(fā)行,《遠(yuǎn)征: 泥濘奔馳》游戲新預(yù)告放出
- (2023-08-26)在坪山建筑中,邂逅未來之城
- (2023-08-26)東風(fēng)集團(tuán)為新品牌造勢!純電專業(yè)的“納米”,有什么本領(lǐng)?
- (2023-08-26)《奧本海默》連續(xù)十天蟬聯(lián)韓國票房冠軍 總觀影人數(shù)達(dá)188萬5775名
- (2023-08-26)山東黃金:擬公開發(fā)行不超過100億元公司債券
- (2023-08-26)第四批西安市工業(yè)互聯(lián)網(wǎng)產(chǎn)業(yè)生態(tài)供給資源池服務(wù)商開始征集
- (2023-08-26)生態(tài)環(huán)境部:我國將跟蹤研判福島核污染水排海影響
- (2023-08-26)又一家mRNA疫苗企業(yè)做起了CDMO | 見智研究
- (2023-08-26)東盟電動汽車標(biāo)準(zhǔn)統(tǒng)一,中國品牌誰更有優(yōu)勢?
- (2023-08-26)2023年湖北退休工資最低多少錢一個月?湖北養(yǎng)老金計算公式2023舉例(全文)
- (2023-08-26)非法集資的錢怎么要回來
- (2023-08-26)8月25日香港銀行間同業(yè)拆借利率(Hibor)