不止 Thor 芯片!英偉達深耕8年,打造智能駕駛量產賦能新範式
發布時間:2026-01-28 來源:轉載 責任編輯:lily
【導讀】CES 2026上,英偉達發布多款汽車領域核心產品與技術,其中開源輔助駕駛模型Alpamayo頗具看點,該模型擁有100億參數,命名寓意技術高地,也呼應了黃仁勳提出的訓練、推理、仿真“三台計算機”技術金字塔概念。英偉達還提出,計算機產業每10-15年將迎來一次平台變革,新一代DRIVE Thor芯片等產品正是其順應這一趨勢的布局。盡管汽車業務營收占比不高,但英偉達已持續投入超8年,且正深度貼合中國客戶需求,提供適配行業發展的技術與產品支持。
為汽車行業提供全棧解決方案
一個優秀的智能駕駛產品,究竟該具備什麼樣的核心特性?在英偉達看來,共有四大特點:第一是性能,既依賴SoC的算力基礎,也離不開算法層麵的深度優化;第二是係統穩定性,隨著國內智能駕駛量產規模擴大,係統的可靠性與安全性成為核心競爭力;第三是易用性,降低開發者的上手門檻,實現車端與雲端 AI 芯片的高效開發,是行業的共同訴求;第四是高效支持,快速響應客戶需求,為項目落地提供全周期技術服務,是客戶最為關注的要點。
黃仁勳反複強調的英偉達核心支柱是三台計算機:用於訓練的DGX、用於仿真的OVX和用於車載推理的AGX。這構成了從數據訓練、仿真驗證到量產部署的完整閉環。而英偉達的解決方案也可以分為三個層麵:SoC芯片、平台和軟件。
第一,SoC芯片方麵,英偉達的車載計算芯片經曆了四代發展:2018年的1TOPS的Parker,到2020年量產於小鵬P7等車型的30TOPS的Xavier,再到2022年254 TOPS的Orin,以及可以達到最高2000TOPS(NVFP4)的Thor。
衡量芯片性能不能隻看算力數值,內存帶寬同樣是關鍵指標。芯片性能如同木桶效應,GPU、CPU與內存帶寬任一環節成為短板,都會製約整體性能發揮。以Thor為例,其內存帶寬高達273GB/s,處於行業領先水平。采用NVFP4和(he)投(tou)機(ji)采(cai)樣(yang),對(dui)內(nei)存(cun)帶(dai)寬(kuan)的(de)需(xu)求(qiu)還(hai)可(ke)以(yi)進(jin)一(yi)步(bu)減(jian)少(shao),從(cong)而(er)使(shi)性(xing)能(neng)有(you)更(geng)好(hao)的(de)發(fa)揮(hui)。此(ci)外(wai),英(ying)偉(wei)達(da)在(zai)芯(xin)片(pian)設(she)計(ji)中(zhong)融(rong)入(ru)了(le)諸(zhu)多(duo)創(chuang)新(xin)架(jia)構(gou),除(chu)了(le)核(he)心(xin)的(de)GPU計算單元,還集成了多種專用加速引擎,確保計算資源的高效利用。在專利布局上,針對車載GPU,英偉達擁有700餘項專利技術。
第二,平台方麵,英偉達嚴格遵循ASPICE和ISO 26262流程,同時獲得了產品級的TÜV的ASIL-D功能安全認證。值得注意的是,行業內部分廠商宣稱的 “安全認證”,需區分是產品認證、架構認證還是流程認證,其中產品功能安全認證的標準最為嚴苛,而英偉達是業內少數完成全流程認證的企業。
英偉達還定義了像Hyperion這樣的參考架構,當前 Hyperion 已發展至第四代,也就是Hyperion 10。該平台在設計之初,就對傳感器配置、係統架構與軟件進行了功能安全分解,明確了支持L4 級自動駕駛所需的算力配置,Hyperion 10搭載兩塊基於 NVIDIA Blackwell 架構的 NVIDIA DRIVE AGX Thor 係統級芯片,可提供超過 2000 TFLOPS FP4 精度 (或 1000 TOPS INT8) 的實時算力。同時,英偉達為每一個軟硬件模塊都設定了明確的功能安全目標,形成了完整的安全需求矩陣。
第三,軟件方麵,英偉達提供兩種可量產的OS選項:QNX和基於Linux的DriveOS。在中國市場,許多企業傾向於Linux,主要因其生態和開發便利性。為此,英偉達將DriveOS QNX中許多客戶重視的功能,如內存ECC校驗、診斷功能遷移到了Linux版本中,從而在保持開發靈活性的同時,增強了係統的可靠性和診斷能力,更大幅縮減了從芯片到量產的時間。
除此之外,在剛剛過去的CES上,英偉達發布的Alpamayo大模型,這是一款融合推理能力的開源VLA大模型,基於Transformer架構打造。英偉達認為,單純的端到端模型缺乏可解釋性,而融入推理能力的Alpamayo模型,能夠讓智能駕駛決策更具邏輯性與可靠性。
針對中國市場的創新
中國團隊緊密配合本地市場的快速需求,英偉達驅動了許多創新產品。
首先,第一個例子是衛星架構下的雷達數據處理優化。傳統毫米波雷達的數據處理由雷達模組內置芯片完成,僅向車載SoC傳輸目標檢測結果。隨著車載SoC算力的提升,車企提出 “將雷達原始數據傳輸至SoC進行處理” 的需求,這一方案可節省雷達模組的硬件成本,並提升算法的靈活性。針對這一需求,英偉達對NvSIPL SDK進行了定製化開發,可支持雷達和激光雷達。同時,把新增雷達原始數據處理模塊部署到SoC的專用加速器(PVA)上,既避免了占用GPU資源,又實現了算力的高效利用。
接著,第二個例子是TensorRT Edge-LLM 的車端適配。2023年英偉達發布了麵向雲端大模型推理的TensorRT LLM SDK,一些車企隨即提出將其移植到車端平台的需求。2024 年,英偉達中國團隊僅用兩周時間,就完成了TensorRT LLM在Orin平台的初步適配。但在後續優化中發現,雲端與車端的技術需求存在顯著差異:雲端關注高吞吐量,而車端受限於傳感器數據輸入規模,對低延遲、低內存占用要求更高。
為此,團隊推出專為車端設計的TensorRT Edge-LLM SDK,並與國內大模型團隊展開合作,完成模型適配與優化。目前,該SDK已支持英偉達全係列嵌入式計算平台,包括車端的Orin與Thor係列、嵌入式的Jetson 係列,以及和聯發科合作開發的C-X1/ C-Y1係列。相較於業內其他推理框架,TensorRT Edge-LLM具備三大優勢:一是支持C++原生開發,更符合車載場景的量產需求;二是深度適配英偉達GPU架構,可充分發揮硬件算力;三是性能優勢顯著,官方數據顯示,其推理效率相較於業界其他大模型推理框架提升兩倍以上。目前,英偉達正在推動該 SDK的功能安全認證。
最後,第三個例子是Orin芯片的性能迭代。Orin芯片作為一款發布三年半的產品,通過TensorRT的版本迭代,Transformer的性能可以提升30-50%;同時基於最新的TensorRT Edge -LLM SDK,Orin同時可以很好的支持7B的大模型,並取得相當好的性能。
從底層的芯片硬件,到中間層的DriveOS與SDK工具鏈,再到上層的感知、規控算法與 Alpamayo大模型,英偉達已構建起全棧式的智能駕駛解決方案。
長期踐行開源模型和工具鏈技術路線
雲端協同也是英偉達的一個發力點。在數據中心端,英偉達主要包括兩個開源模型平台:一是世界基礎模型(WFM)Cosmos,二是CES上剛剛發布的Alpamayo。
開源模型與工具鏈並非英偉達的戰略轉型,而是長期踐行的技術路線,核心目標是通過技術普惠,推動行業發展。
首先,在Cosmos方麵,係統核心構成包括三方麵:一是模型層,涵蓋感知、決策、推理等全鏈路模型;二是工具層,包括數據標注、數據清洗、模型訓練等開源工具;三是數據層,提供豐富的訓練數據集。其中,工具層的兩款工具深受國內企業青睞:一款是用於訓練過程的自動化數據標注工具,可大幅提升標注效率;另(ling)一(yi)款(kuan)是(shi)數(shu)據(ju)檢(jian)索(suo)工(gong)具(ju),能(neng)夠(gou)快(kuai)速(su)定(ding)位(wei)高(gao)質(zhi)量(liang)的(de)訓(xun)練(lian)數(shu)據(ju)。針(zhen)對(dui)中(zhong)國(guo)市(shi)場(chang),英(ying)偉(wei)達(da)將(jiang)原(yuan)本(ben)的(de)英(ying)文(wen)訓(xun)練(lian)腳(jiao)本(ben),優(you)化(hua)為(wei)支(zhi)持(chi)中(zhong)文(wen)的(de)開(kai)源(yuan)版(ban)本(ben),進(jin)一(yi)步(bu)降(jiang)低(di)了(le)開(kai)發(fa)門(men)檻(kan)。
當前智能駕駛行業麵臨著一個核心瓶頸:隨著自動駕駛等級的提升,長尾場景數據采集成本呈指數級增長,傳統“路采-訓練-驗證”模式已難以為繼。這也是近半年來,國內自動駕駛技術突破放緩的重要原因。為此,英偉達提出了生成式AI驅動的解決方案,通過Cosmos、Issac等生成式模型,合成高質量的長尾場景數據,以算力換取數據,破解行業痛點。
生成式模型分為三大類:一是純生成模型,輸入一段真實路況視頻,即可預測後續的場景變化,部分車企已將其應用於仿真測試;二是條件生成模型,通過輸入文本指令,生成特定場景的數據,可精準覆蓋極端天氣、複雜路況等長尾場景;三是風格遷移模型,能夠將2D 仿真場景轉化為逼真的3D數(shu)據(ju),提(ti)升(sheng)仿(fang)真(zhen)測(ce)試(shi)的(de)真(zhen)實(shi)性(xing)。區(qu)別(bie)於(yu)行(xing)業(ye)內(nei)其(qi)他(ta)方(fang)案(an),英(ying)偉(wei)達(da)的(de)生(sheng)成(cheng)式(shi)模(mo)型(xing)核(he)心(xin)優(you)勢(shi)在(zai)於(yu)工(gong)程(cheng)化(hua)量(liang)產(chan)能(neng)力(li),模(mo)型(xing)生(sheng)成(cheng)的(de)數(shu)據(ju)具(ju)備(bei)時(shi)序(xu)一(yi)致(zhi)性(xing)與(yu)場(chang)景(jing)合(he)理(li)性(xing),完(wan)全(quan)滿(man)足(zu)自(zi)動(dong)駕(jia)駛(shi)的(de)訓(xun)練(lian)與(yu)測(ce)試(shi)需(xu)求(qiu)。

其次,在Alpamayo方麵,該模型的核心創新在於因果推理數據集的構建,英偉達首次提出了參考公式化的數據集標注方法,通過“感知-推理-決策”的全鏈路標注,讓模型能夠學習到決策的邏輯,而非簡單的圖像與結果的映射關係。
以施工路麵場景為例,傳統感知模型僅能識別 “施工路麵”這一目標,而Alpamayo模型則會進行多步推理:首先識別 “視線遮擋” 這一關鍵特征,再結合車輛當前的速度、距離等信息,最終輸出“減速慢行”的決策指令。這種推理式的決策邏輯,讓模型具備更強的泛化能力,即便遇到從未訓練過的施工場景,依然能夠做出正確決策。“數據集構建、模型訓練、仿真強化”的全鏈路方案,是Alpamayo模型實現高泛化性的核心原因。
此外,英偉達已開放了原始數據集,該數據集涵蓋全球多地區的真實路況,且已完成脫敏處理,開發者可直接用於模型訓練。

Alpamayo模型的最大價值,在於為L4級(ji)自(zi)動(dong)駕(jia)駛(shi)提(ti)供(gong)了(le)一(yi)條(tiao)高(gao)效(xiao)的(de)實(shi)現(xian)路(lu)徑(jing)。其(qi)可(ke)解(jie)釋(shi)性(xing)的(de)決(jue)策(ce)邏(luo)輯(ji),解(jie)決(jue)了(le)傳(chuan)統(tong)端(duan)到(dao)端(duan)模(mo)型(xing)黑(hei)箱(xiang)的(de)行(xing)業(ye)痛(tong)點(dian),目(mu)前(qian)已(yi)有(you)多(duo)家(jia)車(che)企(qi)計(ji)劃(hua)將(jiang)該(gai)模(mo)型(xing)作(zuo)為(wei)主(zhu)駕(jia)係(xi)統(tong)的(de)核(he)心(xin)算(suan)法(fa),搭(da)配(pei)冗(rong)餘(yu)的(de)安(an)全(quan)係(xi)統(tong),實(shi)現(xian)L4級自動駕駛的量產落地。

開源模型源於與中國客戶的合作
許多開源工作是源於英偉達與企業深度合作中識別到的痛點。有三個典型案例,展現了英偉達創新技術如何賦能智能汽車的量產落地。
第一個案例是蔚來自動駕駛數據處理加速方案。2022年,蔚來在量產車型的數據回傳過程中,麵臨著數據量激增、處理效率低下的難題。英偉達團隊針對這一痛點,開發了一套自動化的數據篩選與預處理方案,最終實現數據處理吞吐量提升6倍。這一方案看似與芯片銷售無直接關聯,但英偉達始終秉持“解決行業痛點”delinian,tongguojishufunengjiangdicheqideyanfachengben,cainengtuidongzhenggexingyedefazhan,zheyeshiyingweidaqubieyuqitaxinpianchangshangdehexinjingzhengli。muqian,gaifanganyijinrukaiyuanliucheng,weilaijiangmianxiangquanxingyekaifang。
第二個案例是英偉達閉環仿真平台NuRec的de本ben土tu化hua落luo地di。國guo內nei頭tou部bu車che企qi的de仿fang真zhen測ce試shi體ti係xi中zhong,均jun能neng看kan到dao該gai平ping台tai的de身shen影ying。該gai平ping台tai的de核he心xin功gong能neng是shi,輸shu入ru一yi段duan路lu采cai數shu據ju,即ji可ke生sheng成cheng多duo樣yang化hua的de場chang景jing變bian體ti,例li如ru調tiao整zheng車che輛liang位wei置zhi、行人行為、天氣狀況等,幫助車企快速完成海量場景的測試驗證。某車企的實踐數據顯示,應用該平台後,仿真測試效率最高可提升35倍,測試成本最多可降低到50分之一,輔助駕駛係統的研發周期從“月級” 縮短至“小時級”。
第三個案例是端到端訓練的存儲優化方案。隨著端到端模型的興起,車企的訓練數據從“單幀圖片”轉向“連續視頻流”,存儲成本激增300%~1000%,成cheng為wei製zhi約yue技ji術shu落luo地di的de新xin瓶ping頸jing。英ying偉wei達da團tuan隊dui針zhen對dui這zhe一yi問wen題ti,開kai發fa了le邊bian解jie碼ma邊bian訓xun練lian的de流liu式shi處chu理li方fang案an,無wu需xu將jiang視shi頻pin數shu據ju完wan整zheng存cun儲chu,即ji可ke直zhi接jie用yong於yu模mo型xing訓xun練lian。該gai方fang案an僅jin增zeng加jia數shu百bai分fen比bi的deGPU開銷,卻能幫助車企節省90%的熱存儲成本,按單車企的訓練規模計算,每年可節省上億元的硬件投入。目前,該方案已在多家車企落地,並將持續迭代優化。
這三個案例的共性在於,英偉達解決的都是車企量產過程中 “真問題”。這些問題看似與芯片算力無關,卻直接決定了技術能否從實驗室走向市場。
總結
從(cong)芯(xin)片(pian)硬(ying)件(jian)的(de)性(xing)能(neng)迭(die)代(dai)到(dao)軟(ruan)件(jian)生(sheng)態(tai)的(de)定(ding)製(zhi)優(you)化(hua),從(cong)開(kai)源(yuan)模(mo)型(xing)的(de)技(ji)術(shu)普(pu)惠(hui)到(dao)量(liang)產(chan)場(chang)景(jing)的(de)痛(tong)點(dian)破(po)解(jie),英(ying)偉(wei)達(da)以(yi)全(quan)棧(zhan)布(bu)局(ju)和(he)長(chang)期(qi)主(zhu)義(yi),構(gou)建(jian)起(qi)智(zhi)能(neng)駕(jia)駛(shi)領(ling)域(yu)的(de)核(he)心(xin)競(jing)爭(zheng)力(li)。Alpamayo模型的因果推理創新、生成式AI的(de)數(shu)據(ju)解(jie)決(jue)方(fang)案(an),以(yi)及(ji)針(zhen)對(dui)中(zhong)國(guo)市(shi)場(chang)的(de)本(ben)土(tu)化(hua)適(shi)配(pei),不(bu)僅(jin)彰(zhang)顯(xian)了(le)技(ji)術(shu)硬(ying)實(shi)力(li),更(geng)體(ti)現(xian)了(le)與(yu)行(xing)業(ye)共(gong)生(sheng)的(de)發(fa)展(zhan)理(li)念(nian)。隨(sui)著(zhe)開(kai)源(yuan)生(sheng)態(tai)的(de)持(chi)續(xu)完(wan)善(shan)和(he)全(quan)棧(zhan)方(fang)案(an)的(de)不(bu)斷(duan)迭(die)代(dai),英(ying)偉(wei)達(da)有(you)望(wang)進(jin)一(yi)步(bu)打(da)破(po)智(zhi)能(neng)駕(jia)駛(shi)量(liang)產(chan)瓶(ping)頸(jing)。

- 噪聲中提取真值!瑞盟科技推出MSA2240電流檢測芯片賦能多元高端測量場景
- 10MHz高頻運行!氮矽科技發布集成驅動GaN芯片,助力電源能效再攀新高
- 失真度僅0.002%!力芯微推出超低內阻、超低失真4PST模擬開關
- 一“芯”雙電!聖邦微電子發布雙輸出電源芯片,簡化AFE與音頻設計
- 一機適配萬端:金升陽推出1200W可編程電源,賦能高端裝備製造
- 貿澤EIT係列新一期,探索AI如何重塑日常科技與用戶體驗
- 算力爆發遇上電源革新,大聯大世平集團攜手晶豐明源線上研討會解鎖應用落地
- 創新不止,創芯不已:第六屆ICDIA創芯展8月南京盛大啟幕!
- AI時代,為什麼存儲基礎設施的可靠性決定數據中心的經濟效益
- 矽典微ONELAB開發係列:為毫米波算法開發者打造的全棧工具鏈
- 車規與基於V2X的車輛協同主動避撞技術展望
- 數字隔離助力新能源汽車安全隔離的新挑戰
- 汽車模塊拋負載的解決方案
- 車用連接器的安全創新應用
- Melexis Actuators Business Unit
- Position / Current Sensors - Triaxis Hall




