8月5日,合創(chuàng)資本「VINNO Day」論壇第07期《自動駕駛中的數(shù)據(jù)戰(zhàn)爭》在燧石星火直播平臺和北大i1898 APP上線。本次分享,合創(chuàng)資本投資企業(yè)--MINIEYE創(chuàng)始人劉國清博士,就自動駕駛中的數(shù)據(jù)戰(zhàn)爭展開精彩分享,直播吸引了3300多位合伙人、被投企業(yè)和投資機構(gòu)在線收看與交流互動。
以下內(nèi)容為直播整理總結(jié):
今天主要聊一聊自動駕駛數(shù)據(jù)。
數(shù)據(jù)閉環(huán)
跟很多人工智能的應(yīng)用一樣,智能駕駛主要涉及三件事,一是算力算法,另外一個就是數(shù)據(jù)。
算力在人工智能行業(yè)里面占據(jù)重要地位,是很關(guān)鍵的一個角色,所以基本上每家芯片公司都在圍繞算力做非常多的研發(fā)投入,持續(xù)有一些新的型號產(chǎn)品。算力的峰值出現(xiàn),不像2014年、2015年的時候可選的車規(guī)級計算平臺只有幾家,而且算力非常有限?,F(xiàn)在,這種瓶頸已經(jīng)逐漸被打破。
算法。如果把數(shù)據(jù)比喻成彈藥的話,算法就是武器?;仡?014年到2018年這個階段,人工智能特別是神經(jīng)網(wǎng)絡(luò)的發(fā)展,是算法迭代的黃金時期,從幾十層到上百層的神經(jīng)網(wǎng)絡(luò)層出不窮,在性能上表現(xiàn)的也是越來越好。 這5年左右的發(fā)展,趕上可能過去10年甚至20年算法的進展。2019年以后,視覺以及一些融合相關(guān)的感知類算法迭代上,進入到一個相對平緩的發(fā)展節(jié)奏。
2019年以后,突破性的算法較少出現(xiàn),更多的集中在一些應(yīng)用,到底怎么把神經(jīng)網(wǎng)絡(luò)的技術(shù)神經(jīng)網(wǎng)絡(luò)算法應(yīng)用到實際場景里去,就是我剛才提到的數(shù)據(jù),它是彈藥。
這是一個典型的人工智能系統(tǒng)架構(gòu)。橙色代表訓(xùn)練的過程,藍色代表推理過程,訓(xùn)練的過程相當(dāng)于處在一個學(xué)習(xí)階段,去掌握一些技能。這個技能可以是識別車、識別語音,識別中文、西班牙語等等,也可以是推薦可能感興趣的 IC、IT類產(chǎn)品。 它涉及到不同的應(yīng)用和任務(wù),具體能夠?qū)崿F(xiàn)什么功能依賴于你的訓(xùn)練數(shù)據(jù)。經(jīng)過這樣一個訓(xùn)練,我們得到了一個模型,基于這些模型就可以進入到influence推理的過程,去實現(xiàn)一些應(yīng)用。
比如,基于人臉識別。可以去做上班打卡的一些產(chǎn)品,基于語音識別或者語音的一些合成等,去做一些跟語音相關(guān)的專業(yè)應(yīng)用等,這其實就是一個典型的人工智能的架構(gòu)。
舉一個例子,疫情后大家都養(yǎng)成了帶口罩的習(xí)慣。以前上班打卡不戴口罩的時候,可以非常準(zhǔn)確地識別到我是誰。但是,當(dāng)我們戴著口罩有可能就無法識別了。但是過了一段時間,又可以支持戴著口罩進行人臉識別了。 其實是因為考勤機缺少戴口罩的數(shù)據(jù),相當(dāng)于它沒有學(xué)習(xí)過這個東西,但是后來隨著需求的增長,以及后臺數(shù)據(jù)針對于帶口罩數(shù)據(jù)的補充,它又掌握了這個新技能。這一點也體現(xiàn)數(shù)據(jù)的價值巨大。
與考勤打卡這種相對可控的環(huán)境下做出的人工智能應(yīng)用而言,自動駕駛相關(guān)的人工智能技術(shù)面臨的挑戰(zhàn)是更大的交通環(huán)境和場景。最核心的一個問題是我們要識別和分析,交通環(huán)境里的各種目標(biāo),它的內(nèi)差很大。比如說,對于人臉,同樣是這個人臉不論白種人,黃種、黑種、大人、老人還是男人,他都是兩個眼睛一個鼻子一張嘴,結(jié)構(gòu)也是非常穩(wěn)定的。在這種情況,對于人臉的表達,內(nèi)差比較小。但是,對于我們要面臨的交通場景里邊的目標(biāo)。比如說,人體有各種各樣的姿態(tài),站立、蹲著、打傘、穿雨衣的時候,甚至還有一些奇裝異服的行為,所以同樣是行人,區(qū)別可能非常大。對于車也是一樣,各種各樣的車型,包括對于光照的影響,天氣的影響等等,這些都造成交通場景下各種目標(biāo)的內(nèi)差很大。
數(shù)據(jù)是戰(zhàn)略資源。從技術(shù)角度來看的話,數(shù)據(jù)的摩爾定律已經(jīng)被打破了,相信用不了多久,在車載車規(guī)級的算力上會有更多像英偉達一樣的企業(yè)去滿足新的硬件平臺,甚至到L3、L5的一些增量需求。
而算法,隨著時間的推移其稀缺性呈邊界遞減;而數(shù)據(jù)它實際可以持續(xù)地擴寬我們的護城河,真正形成長期的壁壘。 如果想要公司去共享自己積累下來的核心數(shù)據(jù)其實是很難接受的,只能靠更多的企業(yè)和聯(lián)盟自己去積累。
到底怎么去積累?一種方式是進行自行采集。像Waymo部署了幾百臺自動駕駛車輛,在美國幾個州進行路測,受到車隊規(guī)模的限制,整個采集的積累過程比較緩慢。積累100億英里數(shù)據(jù)需要76.1年,而業(yè)界普遍認為做L4、L5基本上要做 100億英里以上的里程數(shù)據(jù)。
另外一種方式,通過用戶生成數(shù)據(jù)。比如目前特斯拉的用戶已經(jīng)使用Autopilot系統(tǒng)駕駛了超過10億英里,為他們提供了大量更有針對性的寶貴數(shù)據(jù),更好地了解意外事故。我們MINIEYE則與美國GM聯(lián)合研發(fā),利用已量產(chǎn)的ADAS產(chǎn)品,自動采集“Corner Cases”數(shù)據(jù),幫助L4/L5級自動駕駛的研發(fā)。
如何在整個自動駕駛的演進過程中打造競爭力?如何有效構(gòu)建數(shù)據(jù)閉環(huán)呢?
從量產(chǎn)的產(chǎn)品拿回用戶使用過程中生成的數(shù)據(jù),利用這些數(shù)據(jù)幫助持續(xù)迭代技術(shù),然后利用迭代的技術(shù)實現(xiàn)產(chǎn)品的進化,進而 OTA或者交付給新的客戶,用數(shù)據(jù)去驅(qū)動整個的研發(fā)事情,在自動駕駛的整個版圖上非常重要。
MINIEYE云端數(shù)據(jù)工廠
我們的定位是做自動駕駛體系里面的感知,所以整體數(shù)據(jù)的積累也是圍繞感知的定位來做的。
首先,數(shù)據(jù)怎么生成。目前在前裝、后裝都有一系列產(chǎn)品,包括我們?nèi)ツ昴甑走€推出了一代消費級的駕駛輔助類產(chǎn)品,目前都是集中在L1和L2階段。這些已經(jīng)裝配的產(chǎn)品為我們提供了非常好的數(shù)據(jù)源,我們從這些已經(jīng)量產(chǎn)裝配出去的設(shè)備上,利用自帶的司機或者5G模塊進行通信,幫助我們拿回用戶使用過程中數(shù)據(jù)。
主要包括兩類,一類是交通環(huán)境處理。除了攝像頭數(shù)據(jù)、雷達、超聲波等等這些數(shù)據(jù),不同的車型,不同的數(shù)據(jù)源都有不同的積累。我們既有原始數(shù)據(jù),還有整個的感知數(shù)據(jù),這些感知數(shù)據(jù)幫助我們?yōu)檐囍骱涂蛻籼峁┝笋{駛輔助功能。另一方面,它能夠幫助我們?nèi)ズY選想要的數(shù)據(jù)。除了外部的交通環(huán)境以外,還有駕駛行為數(shù)據(jù)。 包括轉(zhuǎn)向、油門、剎車這些控制類的數(shù)據(jù)。不僅要了解外面的環(huán)境,還要知道在這種環(huán)境下駕駛員是怎么操作的。
其次,數(shù)據(jù)的獲取。當(dāng)然硬件基礎(chǔ)需要通信模塊,目前我們主要兩種方式,一種是自帶的4G或者5G的module,另外一種是T-BOX。通信通過T-BOX回傳到云端,我們自研了分布式架構(gòu),在安全性、擴展性和集成性上都有很好的優(yōu)勢。 基于這樣一套分布式架構(gòu),我們?nèi)プ鋈蝿?wù)管理和任務(wù)下發(fā)。 基于我們的任務(wù)管理系統(tǒng)和裝配件,可以拿回大量的數(shù)據(jù),圍繞這些數(shù)據(jù)我們可以開發(fā)一套大數(shù)據(jù)管理平臺。
最后,數(shù)據(jù)的使用。在數(shù)據(jù)閉環(huán)里,數(shù)據(jù)驅(qū)動非常關(guān)鍵的一個點,是如何提升測試的效率和有效性。測試現(xiàn)在是整個自動駕駛技術(shù)環(huán)節(jié)里面最核心的部分。在我們構(gòu)建的數(shù)據(jù)閉環(huán)以及圍繞數(shù)據(jù)驅(qū)動的研發(fā)體系里面,我們把測試做成了一種在線服務(wù),叫TaaS(Testing as a Service),包含了一系列自主研發(fā)的一些工具和平臺。
拿到數(shù)據(jù)后,我們會通過Mini-Annotation進行半自動化數(shù)據(jù)標(biāo)注。目前,根據(jù)不同的目標(biāo)和任務(wù)基本上達到70~80%的自動化。在我們的TaaS中,還有一個比較核心的部分是Mini-OJ自動化測試系統(tǒng),可以在線實現(xiàn)測試數(shù)據(jù)的管理、分析以及相關(guān)可視化,促進協(xié)作各方面效率提升。
除了軟件和算法層面上的測試以外,硬件在環(huán)也在汽車電子里面很重要的部分。我們硬件在環(huán)做成一種分布式,傳統(tǒng)的在環(huán)整體來講做的比較重,我們通過模擬器的方式盡可能把它小型化和輕量化,并且我們讓所有的HIL都聯(lián)網(wǎng)。整個這樣一套分布式的HIL系統(tǒng)對于高效地去實現(xiàn)硬件相關(guān)的測試也起到了很重要的作用。
我們還做了Mini-SIM自動化仿真測試系統(tǒng)。不同的天氣條件、路況、車型、光照條件等等都可以通過這種仿真的方式去搭建測試環(huán)境,實現(xiàn)相關(guān)主體的測試?;跀?shù)據(jù)發(fā)現(xiàn)問題,基于這些問題,針對性的迭代技術(shù)。通過補充數(shù)據(jù)或者修改我們的網(wǎng)絡(luò)結(jié)構(gòu)重新設(shè)計網(wǎng)絡(luò)模型,幫助我們解決問題,通過OTA算法對我們的量產(chǎn)數(shù)據(jù)設(shè)備進行升級,讓我們的用戶始終都享受最好的服務(wù)。
數(shù)據(jù)的增值服務(wù)
數(shù)據(jù)不僅助力我們構(gòu)建自己的技術(shù)壁壘,幫助我們按照一種漸進式的方式迭代技術(shù),讓感知系統(tǒng)能夠滿足越來越高階的自動駕駛感知需求。除此以外,數(shù)據(jù)的商業(yè)價值也很大,圍繞數(shù)據(jù)我們可以去做一系列的增值服務(wù)。
目前,有一系列的車型和車隊裝載了我們的產(chǎn)品,圍繞這些產(chǎn)品,我們可以把這些數(shù)據(jù)按照一定的需求拿回來?;谶@些數(shù)據(jù),我們一個典型的應(yīng)用就是幫助客戶來進行高精度地圖相關(guān)的數(shù)據(jù)的更新,我們和四維圖新也有很深入的合作。我們通過量產(chǎn)的終端ADAS設(shè)備實時根據(jù)特定需求去捕捉道路的數(shù)據(jù),包括矢量、建圖的數(shù)據(jù)可以回傳到云端,然后在云端幫助四維圖形和其他的客戶,去做高精度地圖。
未來,我們希望能夠從感知跨越到?jīng)Q策,然后打通感知+決策的整個閉環(huán)。