2026智能駕駛分水嶺:蔚來能否憑世界模型重回第一梯隊?
發布時間:2026-02-20 來源:轉載 責任編輯:lily
【導讀】自特斯拉FSD V12率先將端到端大模型引入量產車以來,"規則驅動"向"數據驅動"的範式轉移已成為行業共識——動作是否流暢、能否應對長尾場景、決jue策ce是shi否fou擬ni人ren化hua,取qu代dai了le傳chuan統tong的de功gong能neng清qing單dan,成cheng為wei衡heng量liang智zhi能neng駕jia駛shi體ti驗yan的de新xin標biao尺chi。在zai這zhe場chang由you方fang法fa論lun革ge新xin引yin發fa的de浪lang潮chao中zhong,蔚wei來lai經jing曆li了le從cong規gui則ze構gou建jian到dao數shu據ju驅qu動dong的de艱jian難nan轉zhuan身shen,如ru今jin又you以yi"世界模型+閉環強化學習"的全新架構重新出發。當技術路線的迷霧逐漸散去,蔚來新版NOA能否憑借這套端到端強化學習體係,在複雜的中國城市場景中實現真正的"擬人化"突破,重回行業第一梯隊?
Part 1、蔚來的輔助駕駛的轉型
在中國智能駕駛的迭代中,特斯拉提出的端到端一個拐點,在出現了這個技術變化之後,城市NOA中擬人化變成了非常重要的評價點,規則味比較重,是落後的標誌。
體驗上主要是動作機械、加減速轉向不流暢、卡頓,無法應對各種Corner case, FSD V12、V13 V14 的一路發展,在方法論上特斯拉是一路牽引整個行業的發展。
在蔚來的第一代車型,是圍繞規則來構建的輔助駕駛,確定變道距離、確定的加減速邏輯、確定的安全邊界。在中國複雜的城市場景複雜度下並不完善。
從規則開始,蔚來花了很多時間來切換技術路線。轉向數據驅動過程中,用模型把規則“壓縮”進參數裏,讓係統通過學習大量真實駕駛數據,自己學會如何變道、擇道。
數shu據ju驅qu動dong的de問wen題ti是shi,同tong一yi個ge場chang景jing下xia,人ren類lei的de行xing為wei並bing不bu一yi致zhi。在zai道dao路lu上shang,人ren的de習xi慣guan和he交jiao通tong流liu量liang都dou會hui影ying響xiang決jue策ce,從cong結jie果guo來lai看kan,能neng看kan到dao不bu同tong的de駕jia駛shi員yuan在zai不bu同tong的de位wei置zhi換huan道dao,模mo型xing學xue到dao的de是shi一yi種zhong“折中選擇”,為了安全往往選擇保守跟隨,或者說要真正實現“高效、主動通行”,伴隨著不少的小事故。
為了平衡風險,引入更強的地圖和路徑引導、采集專家駕駛數據並減少行為差異,或者加回一部分規則邏輯。這些都是中國在這段時間走過的路。
Part 2、蔚來新版的NOA
蔚來世界模型在2026年的目標是回到行業的數一數二的位置。方法是對智能輔助駕駛全研發迭代方法進行調整,引入世界模型 + 閉環強化學習的模式。
這也是以端到端係統為基礎,核心分為三步:
基礎行為習得:通過學習海量人類駕駛行為,讓模型形成駕駛答題本,標記各類場景下的行為概率,習得駕駛基本肌肉記憶;
環境深度理解:moxingcongdangqianshikechufa,yucezishenxiayibuduozhongdongzuo,bingtuiyanbutongdongzuoduizhouweihuanjingdeyingxiang,jihuanjingbianhuaduizishenxingweidefanzuoyong,shixianchangdashufenzhongdechangshixusikao,zheshihexinyunxingjizhi;
閉環強化校準:在虛擬「駕駛考場」中,通過數上億輪專業場景訓練和評估反饋,讓模型精準理解「好行為與差行為的區別」,基於駕駛常識和人類經驗校準行為「答題本」,這一過程即為閉環強化學習。
這zhe裏li要yao回hui答da幾ji個ge關guan鍵jian問wen題ti,強qiang化hua學xue習xi到dao底di解jie決jue了le什shen麼me問wen題ti?這zhe是shi給gei結jie果guo打da分fen,讓rang模mo型xing自zi己ji學xue,模mo型xing輸shu出chu行xing為wei後hou,係xi統tong會hui根gen據ju結jie果guo給gei予yu正zheng向xiang或huo負fu向xiang反fan饋kui,讓rang模mo型xing在zai反fan複fu嚐chang試shi中zhong學xue會hui什shen麼me是shi“更優解”,過程本身就是一種自我校正。
在實際訓練中,通過獎勵評估機製直接給行為打分;利用真實人類行為反饋,反推出獎勵信號, 模型在其中會經曆自監督學習,逐步形成穩定的決策偏好。
舉例來說先構建一個仿真環境,在其中設定一條“目標線”,車輛如果順利完成左轉並線,就得到獎勵;完成得越快、越平順,獎勵越高。
在此基礎上,隻保留少量必要的約束,比如壓實線會被扣分,但不再寫複雜規則。在哪個位置變道、如何跨越三條車道、怎樣兼顧效率與安全,全部交給模型在仿真環境中自行探索。
在這樣的基礎上不需要為每一個特殊路口單獨采集數據。隻要仿真環境中構建出“相似結構”的場景,模型就能遷移能力,避免了為成百上千個複雜路口重複采數據的低效過程。目標簡單、約束少,讓模型自己找路徑。
規則一旦極簡,反而更穩定、更通用。
Part 3、實際的體驗
在我們的實際體驗中,換道策略、導航選道,在道路中的刹車控製都有很大的改善。
偏航和複雜路口,是需要“提前判斷”的場景,NOA的係統在快到路口才反應一般感受會很差或者就錯了(要麼壓實線要麼錯了),需要在更早的階段就意識到,模型會提前接收到“未來懲罰”,從而主動調整決策。
實際上,在擬人化抉擇上,比如判斷安心感充足時果斷切入,不魯莽擠壓旁車;目標車道擁堵時,緩慢前行並持續尋找變道空隙;通過蠕行尋找通行空隙,這些行為都是挺大的改善。
結論
蔚來的探索揭示了一個核心趨勢:智能駕駛的下半場競爭,本質上是"學習效率"與"泛化能力"的較量。世界模型賦予係統長時序推演能力,讓車輛能夠"預見"而非"反應";閉環強化學習則通過虛擬考場中的億級輪次訓練,使模型在極少規則約束下自主尋優,實現從"學會開車"到"開好車"的躍遷。實際體驗中換道策略的果斷、複雜路口的提前預判、擁堵場景下的蠕行尋隙,都是這一技術路線落地的直觀印證。
- 噪聲中提取真值!瑞盟科技推出MSA2240電流檢測芯片賦能多元高端測量場景
- 10MHz高頻運行!氮矽科技發布集成驅動GaN芯片,助力電源能效再攀新高
- 失真度僅0.002%!力芯微推出超低內阻、超低失真4PST模擬開關
- 一“芯”雙電!聖邦微電子發布雙輸出電源芯片,簡化AFE與音頻設計
- 一機適配萬端:金升陽推出1200W可編程電源,賦能高端裝備製造
- 大聯大世平集團首度亮相北京國際汽車展 攜手全球芯片夥伴打造智能車整合應用新典範
- 2026北京車展即將啟幕,高通攜手汽車生態“朋友圈”推動智能化體驗再升級
- 邊緣重構智慧城市:FPGA SoM 如何破解視頻係統 “重而慢”
- 如何使用工業級串行數字輸入來設計具有並行接口的數字輸入模塊
- 意法半導體將舉辦投資者會議探討低地球軌道(LEO)發展機遇
- 車規與基於V2X的車輛協同主動避撞技術展望
- 數字隔離助力新能源汽車安全隔離的新挑戰
- 汽車模塊拋負載的解決方案
- 車用連接器的安全創新應用
- Melexis Actuators Business Unit
- Position / Current Sensors - Triaxis Hall


