??在深度學習變得普遍之前的2010年,感知是molex連接器自動駕駛汽車能力的主要限制,但2014年之后基于深度學習的雷達技術、相機還有激光雷達,帶來了技術性能的不斷提升——那么無人駕駛汽車下一步還會迎來哪些挑戰(zhàn)呢?
??在過去的十年里,自動駕駛領域對機器學習的大部分對話都集中在對象檢測上。對安全導航至關重要的是,我們?nèi)绾尾拍芴岣咦詣玉{駛汽車檢測和跟蹤動態(tài)物體的能力?在2010年,當深度學習變得普遍之前,感知是自動駕駛汽車能力的主要限制。其中ImageNet的分類精度在當時作為最先進的解決方案只能達到50%的準確率(相比之下,今天的準確率為88%)。雖然ImageNet分類并不能與當前最先進的目標檢測技術相提并論,但它確實代表了計算機視覺的進步。
??直到2012年,AlexNet成為ImageNet競賽的首批參賽者之一,它利用卷積神經(jīng)網(wǎng)絡進行深度學習。AlexNet在當年的ImageNet競賽上達到了最先進的精度,成為計算機視覺領域最有影響力的方法。
??從2014年開始,基于深度學習(Deep Learning)的雷達技術、相機還有激光雷達,都開始悄悄進入自動駕駛領域。谷歌的自動駕駛汽車與一位坐輪椅的女士用掃帚追趕一只鴨子的奇遇,成為有史以來挑戰(zhàn)感知技術的一個著名例子。
??如今,基于深度學習的感知技術在自動駕駛汽車中應用很常見,我們也看到了技術性能的不斷提升。近年來,VoxelNet、PIXOR和pointpillar等網(wǎng)絡推動了計算機視覺技術的發(fā)展。盡管機器人不會像人類那樣完美的感知,但計算機視覺的發(fā)展如此之快,可以說它現(xiàn)在已經(jīng)不再是自動駕駛汽車商業(yè)化應用的主要障礙。
? 那么無人駕駛汽車接下來呢?預測!
??既然我們已經(jīng)安全地探測到周圍的關鍵物體,接下來就是預測它們下一步的行動。正確的預測意味著我們將在正確的時間執(zhí)行正確的策略,同時考慮周圍人的行動。預測錯誤意味著我們可能把自己推入危險的境地。我們需要使用成千上萬的環(huán)境輸入來進行盡可能正確的預測。
? ??預測是無保護左轉彎最難實現(xiàn)的核心問題。自動駕駛汽車在轉彎前必須預測周圍所有動態(tài)智能體的未來動作,這一任務比自動駕駛中的其他問題需要更多的智能。人類駕駛員雖然不是完美的,但主要依賴其大腦、駕駛經(jīng)驗和心理暗示(如輕推或手勢等),來成功地執(zhí)行無保護左轉彎。
??雖然機器相對于人類也有一些明顯的優(yōu)勢(比如360°的遠程視覺),但與人類相比,自動駕駛技術中的預測能力可能落后很多。
1、感知模塊檢測輸出自動駕駛汽車一定半徑內(nèi)的一組目標 (如車輛、行人等),然后輸入給預測模塊;
2、預測模塊使用當前的方位、速度和之前的觀察來生成關于每個對象在接下來5秒內(nèi)可能做什么的預測;
3、通過將所有這些預測輸入一個算法,最終生成一個關于自動駕駛汽車可以執(zhí)行的最安全操作的假設;
4、自動駕駛汽車實時計算,每100毫秒重新評估決策。
??可以看到,這種傳統(tǒng)的計算方式會導致不安全和潛在危險的駕駛行為,尤其是在密集的城市環(huán)境中。在過去的幾年里,我們見證了用深度學習方法進行預測的很多實驗。這些方法有可能顯著提高預測的準確性,將它們從機器人轉變?yōu)轭惾恕?/span>
??用數(shù)據(jù)驅動的方法來解決這些傳統(tǒng)的預測問題,與2010年的深度學習如何取代傳統(tǒng)認知技術驚人地相似。
下面是一些實際的例子:
? 克魯斯的感知工程師做了一次偉大的演講,關于他們?nèi)绾螌㈩A測問題轉化為一個分類問題。我對他們構建的工具特別感興趣,這些工具支持快速實驗,并具有快速學習場景和自動標記的能力。