2026智能駕駛分水嶺：蔚來能否憑世界模型重回第一梯隊？-互連技術-電子元件技術網

Warning: file_put_contents(Tpl/0-fzl.cn//cache_html/593419eddb7cebe8f527280f3f0916f1): Failed to open stream: No space left on device in /www/wwwroot/www.Jx.com/index.php on line 151
2026智能駕駛分水嶺：蔚來能否憑世界模型重回第一梯隊？-互連技術-電子元件技術網

你的位置：首頁 > 互連技術 > 正文

2026智能駕駛分水嶺：蔚來能否憑世界模型重回第一梯隊？

發布時間：2026-02-20 來源：轉載責任編輯：lily

【導讀】自特斯拉FSD V12率先將端到端大模型引入量產車以來，"規則驅動"向"數據驅動"的範式轉移已成為行業共識——動作是否流暢、能否應對長尾場景、決jue策ce是shi否fou擬ni人ren化hua，取qu代dai了le傳chuan統tong的de功gong能neng清qing單dan，成cheng為wei衡heng量liang智zhi能neng駕jia駛shi體ti驗yan的de新xin標biao尺chi。在zai這zhe場chang由you方fang法fa論lun革ge新xin引yin發fa的de浪lang潮chao中zhong，蔚wei來lai經jing曆li了le從cong規gui則ze構gou建jian到dao數shu據ju驅qu動dong的de艱jian難nan轉zhuan身shen，如ru今jin又you以yi"世界模型+閉環強化學習"的全新架構重新出發。當技術路線的迷霧逐漸散去，蔚來新版NOA能否憑借這套端到端強化學習體係，在複雜的中國城市場景中實現真正的"擬人化"突破，重回行業第一梯隊？

Part 1、蔚來的輔助駕駛的轉型

在中國智能駕駛的迭代中，特斯拉提出的端到端一個拐點，在出現了這個技術變化之後，城市NOA中擬人化變成了非常重要的評價點，規則味比較重，是落後的標誌。

體驗上主要是動作機械、加減速轉向不流暢、卡頓，無法應對各種Corner case， FSD V12、V13 V14 的一路發展，在方法論上特斯拉是一路牽引整個行業的發展。

在蔚來的第一代車型，是圍繞規則來構建的輔助駕駛，確定變道距離、確定的加減速邏輯、確定的安全邊界。在中國複雜的城市場景複雜度下並不完善。

從規則開始，蔚來花了很多時間來切換技術路線。轉向數據驅動過程中，用模型把規則“壓縮”進參數裏，讓係統通過學習大量真實駕駛數據，自己學會如何變道、擇道。

數shu據ju驅qu動dong的de問wen題ti是shi，同tong一yi個ge場chang景jing下xia，人ren類lei的de行xing為wei並bing不bu一yi致zhi。在zai道dao路lu上shang，人ren的de習xi慣guan和he交jiao通tong流liu量liang都dou會hui影ying響xiang決jue策ce，從cong結jie果guo來lai看kan，能neng看kan到dao不bu同tong的de駕jia駛shi員yuan在zai不bu同tong的de位wei置zhi換huan道dao，模mo型xing學xue到dao的de是shi一yi種zhong“折中選擇”，為了安全往往選擇保守跟隨，或者說要真正實現“高效、主動通行”，伴隨著不少的小事故。

為了平衡風險，引入更強的地圖和路徑引導、采集專家駕駛數據並減少行為差異，或者加回一部分規則邏輯。這些都是中國在這段時間走過的路。

Part 2、蔚來新版的NOA

蔚來世界模型在2026年的目標是回到行業的數一數二的位置。方法是對智能輔助駕駛全研發迭代方法進行調整，引入世界模型 + 閉環強化學習的模式。

這也是以端到端係統為基礎，核心分為三步：

基礎行為習得：通過學習海量人類駕駛行為，讓模型形成駕駛答題本，標記各類場景下的行為概率，習得駕駛基本肌肉記憶；

環境深度理解：moxingcongdangqianshikechufa，yucezishenxiayibuduozhongdongzuo，bingtuiyanbutongdongzuoduizhouweihuanjingdeyingxiang，jihuanjingbianhuaduizishenxingweidefanzuoyong，shixianchangdashufenzhongdechangshixusikao，zheshihexinyunxingjizhi；

閉環強化校準：在虛擬「駕駛考場」中，通過數上億輪專業場景訓練和評估反饋，讓模型精準理解「好行為與差行為的區別」，基於駕駛常識和人類經驗校準行為「答題本」，這一過程即為閉環強化學習。

這zhe裏li要yao回hui答da幾ji個ge關guan鍵jian問wen題ti，強qiang化hua學xue習xi到dao底di解jie決jue了le什shen麼me問wen題ti？這zhe是shi給gei結jie果guo打da分fen，讓rang模mo型xing自zi己ji學xue，模mo型xing輸shu出chu行xing為wei後hou，係xi統tong會hui根gen據ju結jie果guo給gei予yu正zheng向xiang或huo負fu向xiang反fan饋kui，讓rang模mo型xing在zai反fan複fu嚐chang試shi中zhong學xue會hui什shen麼me是shi“更優解”，過程本身就是一種自我校正。

在實際訓練中，通過獎勵評估機製直接給行為打分；利用真實人類行為反饋，反推出獎勵信號，模型在其中會經曆自監督學習，逐步形成穩定的決策偏好。

舉例來說先構建一個仿真環境，在其中設定一條“目標線”，車輛如果順利完成左轉並線，就得到獎勵；完成得越快、越平順，獎勵越高。

在此基礎上，隻保留少量必要的約束，比如壓實線會被扣分，但不再寫複雜規則。在哪個位置變道、如何跨越三條車道、怎樣兼顧效率與安全，全部交給模型在仿真環境中自行探索。

在這樣的基礎上不需要為每一個特殊路口單獨采集數據。隻要仿真環境中構建出“相似結構”的場景，模型就能遷移能力，避免了為成百上千個複雜路口重複采數據的低效過程。目標簡單、約束少，讓模型自己找路徑。

規則一旦極簡，反而更穩定、更通用。

Part 3、實際的體驗

在我們的實際體驗中，換道策略、導航選道，在道路中的刹車控製都有很大的改善。

偏航和複雜路口，是需要“提前判斷”的場景，NOA的係統在快到路口才反應一般感受會很差或者就錯了（要麼壓實線要麼錯了），需要在更早的階段就意識到，模型會提前接收到“未來懲罰”，從而主動調整決策。

實際上，在擬人化抉擇上，比如判斷安心感充足時果斷切入，不魯莽擠壓旁車；目標車道擁堵時，緩慢前行並持續尋找變道空隙；通過蠕行尋找通行空隙，這些行為都是挺大的改善。

結論

蔚來的探索揭示了一個核心趨勢：智能駕駛的下半場競爭，本質上是"學習效率"與"泛化能力"的較量。世界模型賦予係統長時序推演能力，讓車輛能夠"預見"而非"反應"；閉環強化學習則通過虛擬考場中的億級輪次訓練，使模型在極少規則約束下自主尋優，實現從"學會開車"到"開好車"的躍遷。實際體驗中換道策略的果斷、複雜路口的提前預判、擁堵場景下的蠕行尋隙，都是這一技術路線落地的直觀印證。

3-958x200_20251021044704_586_20260213110352_663_20260218181015_530.png

上一篇：4200VAC耐壓測試頻頻失效？警惕串聯隔離的電壓堆疊陷阱

下一篇：14.4Gbps！SK海力士刷新LPDDR6速度紀錄

特別推薦

技術文章更多>>

技術白皮書下載更多>>

熱門搜索

友情鏈接(QQ：317243736)

我愛方案網 ICGOO元器件商城創芯在線檢測芯片查詢天天IC網電子產品世界無線通信模塊控製工程網電子開發網電子技術應用與非網世紀電源網 21ic電子技術資料下載電源網電子發燒友網中電網中國工業電器網連接器礦山設備網工博士智慧農業工業路由器天工網乾坤芯電子元器件采購網亞馬遜KOL 聚合物鋰電池工業自動化設備企業查詢工業路由器元器件商城連接器 USB中文網今日招標網塑料機械網農業機械中國IT產經新聞網高低溫試驗箱

關閉

關閉