版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系我們

特斯拉“白日見鬼”引熱議,汽車視覺識別有哪些解決方案?

北京科技報社
愛科學(xué) 懂科技 有未來,北京科技報出品
收藏

一段汽車經(jīng)過墓地時輔助系統(tǒng)“白日見鬼”的視頻引起熱議,汽車視覺識別到底依靠什么來判斷前面有沒有人?

撰文/記者/趙天宇 編輯/劉昭

新媒體編輯/陳炫之

采訪專家

龔建偉(北京理工大學(xué)機械與車輛學(xué)院副教授、智能車輛研究所所長)

殷 瑋(上汽集團智能駕駛環(huán)境融合系統(tǒng)經(jīng)理)

近日,有網(wǎng)友發(fā)布一則特斯拉行經(jīng)墓地的視頻。視頻中,車輛行駛過程中,屏幕上的雷達顯示,前方出現(xiàn)了行人從車輛前路過,但觀看錄制的視頻,卻未見一人。

特斯拉“白日見鬼”引熱議,汽車視覺識別有哪些解決方案?

(點擊這里觀看)

視頻一經(jīng)上傳,迅速成為了業(yè)內(nèi)外的熱點話題,畢竟在墓地這樣的環(huán)境當(dāng)中,這種“白日見鬼”的場景,足夠讓人膽戰(zhàn)心驚。

其實在人工智能、自動駕駛技術(shù)不斷發(fā)展的當(dāng)下,這樣的小插曲,也給自動駕駛兩大流派之一的“純視覺方案”未來發(fā)展,提供了更多的“想象”空間。

▼▼▼

“活見鬼”還是“真故障”?

在墓地識別出人影?這讓許多人感到驚悚不已,但認真梳理一下不難發(fā)現(xiàn),對于特斯拉而言,這并非偶然事件。

此前也有一位網(wǎng)友發(fā)布過類似的視頻:一輛特斯拉行駛在一隧道內(nèi),突然車輛中控雷達探測到兩側(cè)有公交車出現(xiàn),從雷達監(jiān)控可見車輛右側(cè)出現(xiàn)一輛類似公交車的物體,這個物體持續(xù)出現(xiàn)了10分鐘左右。

特斯拉“白日見鬼”引熱議,汽車視覺識別有哪些解決方案?

△在空無一人的隧道中感應(yīng)出公交車

無獨有偶,另一位網(wǎng)友也在空蕩蕩的地下車庫里發(fā)現(xiàn),他的特斯拉感應(yīng)到了虛擬人的現(xiàn)象,而且“有圖有真相”。

特斯拉“白日見鬼”引熱議,汽車視覺識別有哪些解決方案?

△特斯拉在地庫當(dāng)中識別出人像

上汽集團智能駕駛環(huán)境融合系統(tǒng)專家、特斯拉研究者殷瑋認為,按特斯拉自動駕駛系統(tǒng)的特點,若檢測到有行人從車前方經(jīng)過,會觸發(fā)AEB自動輔助剎車系統(tǒng)。但這些視頻當(dāng)中無一例外的都沒有人,因此這是視覺識別系統(tǒng)出現(xiàn)了問題。

據(jù)了解,特斯拉自研的自動駕駛系統(tǒng)名叫Autopilot,但因為翻譯的問題,也有人解釋為自動輔助駕駛系統(tǒng)。它主要開發(fā)路線是機器視覺方向,依靠攝像頭、毫米波雷達等部件采集車輛周圍和前方的環(huán)境信息,并通過計算模塊,對相關(guān)情況進行分析判斷,反饋給駕駛員或系統(tǒng)本身,供參考和決策。

“視覺識別系統(tǒng)的基底是深度學(xué)習(xí)模型,深度學(xué)習(xí)是一種通過訓(xùn)練網(wǎng)絡(luò)模型得到的結(jié)果,本身也做不到100%的準(zhǔn)確,出現(xiàn)誤判斷是正常的現(xiàn)象,只是在墓地這種特殊環(huán)境當(dāng)中,看起來很有話題性而已。”殷瑋說。

特斯拉客服的說法也證實了殷瑋的觀點,此前有媒體記者就此事聯(lián)系過特斯拉客服,客服表示,車主長時間不洗車,太多灰塵覆蓋在傳感器上,導(dǎo)致傳感錯誤是有可能的。并強調(diào)說,不能完全通過屏幕畫面去判斷車道具體情況。不同車輛,感應(yīng)的失誤情況不同,不能一概而論。

實際上,除了在墓地感應(yīng)到行人這種“無中生有”的操作以外,Autopilot的“有中生無”更加讓人頭疼。在一次次慘痛事故中,開啟Autopilot系統(tǒng)的特斯拉汽車,仿佛真的“瞎了眼”,先后撞上過前方的清掃車、拖掛車、水泥墩、消防車……

無論是墓地檢測到行人也好,還是自動駕駛時撞上前方障礙物也罷,這些在普通人眼中毫無難度的識別,為什么到了視覺識別系統(tǒng)當(dāng)中,就成為了棘手的難題?難道這些傳感器都是形同虛設(shè)嗎?

▼ ▼ ▼

“端到端”為何特別難?

其實最簡單的原因就是,目前在感知層面,視覺識別的方案,滿足不了復(fù)雜環(huán)境下的感知需求。

北京理工大學(xué)機械與車輛學(xué)院副教授、智能車輛研究所所長龔建偉解釋說,視覺方案當(dāng)中,攝像頭獲取的視頻數(shù)據(jù)與人眼感知的真實世界最為相似,也最接近人類駕駛的形態(tài)。攝像頭怎樣識別物體?這需要用機器學(xué)習(xí)來實現(xiàn)。

但深度學(xué)習(xí)需要大量的樣本做支持,就拿靜態(tài)物體來說,形態(tài)千差萬別,而對于汽車來說,路上的各種物體又是變幻莫測,很多樣本攝像頭根本就沒見過, “學(xué)習(xí)”都談不上,就更不要說“深度”了。

特斯拉“白日見鬼”引熱議,汽車視覺識別有哪些解決方案?

△圖片來源/Wired

所以撞消防車車尾或奇特形狀隔離墩欄桿等事故,或者在空無一人的地方識別出行人,應(yīng)該就是沒有進行過樣本訓(xùn)練,或者訓(xùn)練度不夠所造成的。

和手機、相機的攝像頭一樣,汽車攝像頭對感光的要求同樣特別高,所以對天氣和照明條件特別敏感,非常容易受到惡劣環(huán)境的影響,而且無法直觀判斷景深,對算法、算力的要求都很高。

所以單純依靠攝像頭的純視覺方案,也被稱之為“端到端”的駕駛模式,也就是完全不經(jīng)過中間決策的一種純視覺方案。在殷瑋看來,“端到端”的駕駛模式需要針對不同車型重新訓(xùn)練,達不到軟件的零邊際成本,即使車輛型號一致,出廠前也要對攝像頭等傳感器進行參數(shù)調(diào)整,以達到最佳效果,自然又增加了不小的成本。并且系統(tǒng)的可解釋性比較差,只能根據(jù)目前已知的數(shù)據(jù)進行推斷,對于陌生數(shù)據(jù)的適應(yīng)性也不太好?!斑@種純視覺方案還只停留在學(xué)術(shù)上,沒有任何工程價值。”殷瑋表示。

特斯拉“白日見鬼”引熱議,汽車視覺識別有哪些解決方案?

△圖片來源/tesla

目前業(yè)界并沒有真正意義上的,純視覺的識別方案,就連特斯拉也不得不拉來毫米波雷達助陣。毫米波雷達具有傳輸距離遠、性能穩(wěn)定、成本可控等優(yōu)點,但其同樣也存在角度分辨率弱、辨識精度低等缺陷,尤其是受電磁波反射敏感度影響,有些橡膠類靜態(tài)物反射不好,識別也會比較困難。

比如說,毫米波雷達因為分辨率不高,空間分辨率較差,在道路上遇到金屬路牌或者停放的汽車時,只能“看到一個大概的形狀,但不知道具體是什么”。所以,在算法上只能忽略相對于路面不移動的雷達回波。否則,每次經(jīng)過路標(biāo)等靜物時,汽車都會驚慌失措,也就談不上什么駕駛了。

多傳感器融合會是應(yīng)用終局嗎?

除了特斯拉以外,目前入局自動駕駛的車企,在技術(shù)路線上都不約而同地選擇了激光雷達路線用性能更強的激光雷達,把所有角落都掃一遍,再加上一些學(xué)習(xí)算法,就可以勾勒出障礙物的范圍,知道車往哪里開了。

從谷歌Waymo、通用 Cruise再到國內(nèi)的百度Apollo、文遠知行,幾乎所有發(fā)布 L4 級自動駕駛乘用車解決方案的公司,車頂上都出現(xiàn)了顯眼的激光雷達。

特斯拉“白日見鬼”引熱議,汽車視覺識別有哪些解決方案?

但激光雷達也不是“通關(guān)鑰匙”,雖然它的探測距離和準(zhǔn)確性都大大高于攝像頭,但不能識別顏色,無法完成追蹤目標(biāo)的任務(wù),雨霧天的抗干擾性也不好。最為重要的是,激光雷達非常昂貴,給自動駕駛硬件增加了大量費用。

作為產(chǎn)業(yè)從業(yè)者,殷瑋對純視覺技術(shù)路線并不看好。如果以自動駕駛輔助系統(tǒng)為標(biāo)準(zhǔn)來看,Autopilot目前是符合標(biāo)準(zhǔn)的。但如果以自動駕駛為標(biāo)準(zhǔn),純視覺方案目前只能滿足L2級別的自動駕駛,再往上提升一個檔次也很困難。

作為行業(yè)研究者,龔建偉給出了不同的觀點。在他看來,特斯拉目前的Autopilot并不是真正意義上的純視覺方案,而是需要雷達參與其中。馬斯克之所以不采用激光雷達,可能因為特斯拉涉水自動駕駛領(lǐng)域比較早,當(dāng)時激光雷達方案不成熟,只能用視覺方案進行產(chǎn)業(yè)化,后來也就一直延續(xù)這樣的技術(shù)路線了。

“最為重要的是,純視覺方案并非原地踏步,例如攝像頭從單目變?yōu)榱穗p目,可以更好地模擬人眼,對于景深也有更加直觀的認識?!饼徑▊フf,隨著深度學(xué)習(xí)的持續(xù),樣本訓(xùn)練量的增加,純視覺方案未來必然會變得越來越聰明,這可能只是一個時間問題。

因此在現(xiàn)有技術(shù)背景之下,越來越多的行業(yè)從業(yè)者,開始推崇多傳感器融合的第三種技術(shù)路線,畢竟無人駕駛系統(tǒng)的可靠性和安全性,是早日產(chǎn)業(yè)化最為關(guān)鍵的因素。

在這套方案當(dāng)中,高精度毫米波雷達、攝像頭和激光雷達這三種傳感器得到了融合,并對信息數(shù)據(jù)做好排序和決策。

對于人命關(guān)天的自動駕駛來說,多一些追求保險的觀念,并不是什么壞事。

這樣看來,即便哪個廠商具備了自動駕駛的硬件基礎(chǔ),也不意味著馬上就能擁有完全自動駕駛能力。因為無論是對于每一個單獨的傳感器,還是對于不同傳感器之間的融合,都還需要一定的時間來進行學(xué)習(xí)和改進。

特斯拉“白日見鬼”引熱議,汽車視覺識別有哪些解決方案?

出品:科普中央廚房

監(jiān)制:北京科技報 | 科學(xué)加客戶端

歡迎朋友圈轉(zhuǎn)發(fā)

未經(jīng)授權(quán)謝絕轉(zhuǎn)載,違者必究