隨著智能化技術(shù)的發(fā)展,駕駛輔助系統(tǒng)(ADAS)正從單純的目標(biāo)識別,逐步向?qū)?fù)雜交通場景的理解與風(fēng)險預(yù)判能力演進。近年來,生成式人工智能(Generative AI)與視覺語言模型(VLM)的發(fā)展,為車輛環(huán)境感知提供了新的技術(shù)路徑。圍繞這一方向,電裝正推進相關(guān)技術(shù)開發(fā),通過生成式AI提升駕駛輔助系統(tǒng)對道路風(fēng)險的識別與分析能力。
從目標(biāo)識別到場景理解
在真實道路環(huán)境中,交通風(fēng)險并不總是直接可見。車輛、行人、自行車等交通參與者可以通過圖像識別技術(shù)進行檢測,但其行為意圖以及可能產(chǎn)生的潛在風(fēng)險,則往往需要結(jié)合交通環(huán)境與場景關(guān)系進行綜合判斷。
例如,在交叉路口附近,接近的車輛是否可能并線、停靠車輛后方是否可能出現(xiàn)行人等情況,都是駕駛過程中需要提前關(guān)注的風(fēng)險因素。這類判斷不僅依賴于對物體的識別,還需要對整體交通場景進行理解。
傳統(tǒng)視覺識別模型在物體檢測和分類方面已經(jīng)具備較高能力,但在復(fù)雜場景語義理解方面仍存在提升空間。基于此,電裝在技術(shù)開發(fā)過程中引入生成式AI模型,通過結(jié)合圖像信息與語言理解能力,對交通場景進行更深入的語義分析。
通過生成式AI進行風(fēng)險推測
在技術(shù)開發(fā)過程中,團隊將風(fēng)險識別任務(wù)拆分為兩個層面:
一是對圖像中已經(jīng)出現(xiàn)的交通參與者進行識別與狀態(tài)判斷,即“顯性風(fēng)險識別”;
二是結(jié)合道路環(huán)境和場景信息,對可能出現(xiàn)的潛在危險進行推測,例如遮擋區(qū)域或可能發(fā)生的合流、突發(fā)行為等,即“潛在風(fēng)險預(yù)測”。
在此基礎(chǔ)上,模型不僅需要識別交通參與者,還需要以自然語言形式描述風(fēng)險類型及其原因,并生成相應(yīng)的駕駛策略提示。
在此基礎(chǔ)上,系統(tǒng)能夠在傳統(tǒng)視覺識別基礎(chǔ)上進一步理解交通場景的語義關(guān)系,從而對潛在風(fēng)險進行更加全面的判斷。
構(gòu)建更接近人類駕駛邏輯的模型評估
在模型開發(fā)過程中,電裝對多種生成式AI模型進行了性能評估,并通過圖像識別基準(zhǔn)數(shù)據(jù)集開展對比測試。
研究團隊發(fā)現(xiàn),傳統(tǒng)基于詞序匹配和詞頻統(tǒng)計的自然語言評價方法,在評估交通場景描述時難以充分反映語義層面的理解能力。因此,在評價體系中引入了基于語義相似度的評估方法,以更準(zhǔn)確地衡量模型生成內(nèi)容與場景描述之間的語義一致性。
行業(yè)資訊、企業(yè)動態(tài)、峰會活動可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報生成中...