網(wǎng)易首頁 > 網(wǎng)易號 > 正文申請入駐

4nm！比亞迪自研AI芯片來了：制程對齊英偉達，算力拉爆特斯拉

2026-05-29 22:28:53　來源: 智能車參考

北京舉報

分享至

璇璣A3來了：

中國第一顆車規(guī)級4納米智駕芯片，橫空出世：從自主研發(fā)、設(shè)計、測試完全自主完成。

三顆組合超2100 TOPS，但更重要的是對比通用GPU架構(gòu)，單位功耗低20%，結(jié)合自研算法，深度優(yōu)化算力資源利用率提升100%。

算力榜上的TOPS不再是唯一的信仰。

AI汽車競爭，從“買誰家的芯片”、“多大算力”變成了“誰真正懂自己的芯片”。

而最令人意想不到的，第一顆4nm智駕芯片，竟然出自以前那個被認(rèn)為技能點全點在電動化的比亞迪——王傳福。

國內(nèi)最先進制程智駕芯片，出自比亞迪

璇璣A3采用4nm車規(guī)級制程，全球車載AI計算芯片中，是和英偉達Thor同處T0梯隊的級別。

其實自研計算芯片，無論從比亞迪自身技術(shù)實力、技術(shù)發(fā)展趨勢還是比亞迪一貫的垂直整合戰(zhàn)略出發(fā)，發(fā)布會之就已經(jīng)是一個“公開的秘密”——不做，才是出人意料的big news。

但比亞迪最終拿出的產(chǎn)品方案，還是給了所有人震撼：

制程、算力除了此前的普遍預(yù)期——多數(shù)人推測比亞迪首款智駕芯片能對標(biāo)英偉達Orin（254 TOPS），或者地平線J6M，主要解決中低介輔助駕駛問題。

但璇璣A3直接邁向了Thor所在的段位，并且在先進制程這一項，領(lǐng)跑了中國玩家陣營。

更重要的，這顆芯片的自主研發(fā)、設(shè)計、測試全部由比亞迪自主完成，輔助駕駛?cè)溌房煽兀⑶乙呀?jīng)規(guī)模化量產(chǎn)。

我們總結(jié)了一張參數(shù)對照表：

解釋一下這些參數(shù)的實際含義。

制程大家最熟悉（4nm）決定了晶體管密度和能效，數(shù)字越小性能上限越高。王傳福給出的解釋是，車規(guī)級4nm的技術(shù)難度大致相當(dāng)于消費電子領(lǐng)域的2nm。

這句話并不是嚴(yán)格的技術(shù)定義，而是一句通俗易懂的類比，邏輯在于車規(guī)級芯片在同樣先進制程（如4nm）下，其設(shè)計與制造難度是一個跨越式的疊加。

因為車規(guī)級芯片不僅是“更高性能”的芯片，本質(zhì)上是為“安全”而生的專業(yè)芯片，尤其是在4nm這樣的先進制程上，設(shè)計時必須引入大量的冗余設(shè)計和容錯電路、制造中也會使用更昂貴的材料，并增加特定的工藝步驟。

CPU部分為16核，420K DMIPS，負(fù)責(zé)全局調(diào)度和邏輯決策，這個算力足以同時處理智駕、座艙、車身控制的復(fù)雜任務(wù)。

內(nèi)存帶寬273GB/s，配合自研總線，硬件支持可納秒級低延遲。

單位算力功耗比同級產(chǎn)品低20%，意味著同樣計算任務(wù)下發(fā)熱更少、系統(tǒng)穩(wěn)定性更高。

算力利用率提升100%則是容易被忽視但非常關(guān)鍵的一點，這涉及到璇璣A3本質(zhì)：NPU（神經(jīng)網(wǎng)絡(luò)處理單元），專為AI推理設(shè)計，而非從圖形渲染衍生而來的通用GPU。

通用芯片為了兼容多種客戶需求必然存在架構(gòu)妥協(xié)，而璇璣A3針對比亞迪自研算法深度定制，使得同樣的理論算力能夠跑出兩倍的有效性能。

NPU的優(yōu)勢在于將矩陣乘法、卷積等AI常用算子直接硬化，同樣的晶體管面積能產(chǎn)出更高的有效算力。同時針對比亞迪自研算法肯定會深度定制，使得同樣的理論算力能夠跑出更高的有效性能。

自主最先進制程車載智駕芯片，的確夠重磅，但從算力本身來看，絕對數(shù)值不是No.1。

而真正讓璇璣A3區(qū)別于其他方案的，不在制程和算力，是能效和利用率上的差異化路線——大力出奇跡比拼理論峰值TOPS時，比亞迪把重心放在了“實際有效算力”上。

比亞迪的璇璣A3，能稱為AI汽車“芯皇”嗎？

技術(shù)路線上，璇璣A3選擇了專用NPU，而非英偉達Orin、Thor那樣的通用GPU衍生架構(gòu)。

GPU最早是為了做圖形渲染而生的，擅長同時處理海量相似的任務(wù)在黃仁勛的帶領(lǐng)下，英偉達把GPU變成了通用并行計算平臺，使得GPU不但可以做圖形相關(guān)的任務(wù)，還可以做科學(xué)計算、數(shù)學(xué)分析以及AI訓(xùn)練。

這也是英偉達有如今江湖地位的根基。

而NPU中文叫神經(jīng)網(wǎng)絡(luò)處理器或者AI加速器。相比于GPU， NPU更加的注重 AI 相關(guān)的任務(wù)。

如果把GPU和NPU都看成工人的話， GPU就像經(jīng)驗更豐富一些的老師傅，會干很多東西，效率比較高。

NPU則是專門訓(xùn)練過的流水線工人，技能單一，但是專注的做一件事情且效率極高——高效運行AI模型。

通用GPU的優(yōu)勢是生態(tài)成熟、工具鏈完善、客戶接受度高，但代價是為了兼容不同車企、不同算法、不同模型，硬件資源必須保持一定的“靈活性”，這種靈活性是以面積和功耗為代價的。

它把矩陣乘法、卷積、激活函數(shù)等算子直接“硬化”，省去了圖形渲染和通用計算的冗余邏輯。同樣的晶體管數(shù)量，NPU能產(chǎn)出更高的實際算力；同樣的算力需求，NPU功耗更低。這就是璇璣A3單位算力功耗低20%、算力利用率提升100%的根本原因。

這種專用架構(gòu)帶來的體驗提升首先體現(xiàn)在削弱延遲上。

城市領(lǐng)航場景中，從傳感器采集到?jīng)Q策執(zhí)行，中間要經(jīng)過感知、預(yù)測、規(guī)劃、控制等多個環(huán)節(jié)，每一步都涉及大量計算。算力不夠或架構(gòu)效率低，系統(tǒng)就會“猶豫”——被加塞、在復(fù)雜路口磨蹭、該繞行時不敢動。

璇璣A3的3核NPU原生支持Transformer大模型，能配合自研總線實現(xiàn)納秒級數(shù)據(jù)調(diào)度。發(fā)布會上展示的實測中，搭載璇璣A3的車輛在深圳坪山老街穿行，面對突然竄出的電動車、路邊臨停車輛、窄道多把掉頭等場景，表現(xiàn)出的是“絲滑”而非“機械”：

更低延遲還意味著更高的安全下限。人類的反應(yīng)時間約300到500毫秒，普通智駕系統(tǒng)可壓縮到100毫秒左右，而專用NPU可以進一步縮短這個窗口。反應(yīng)越快，留給系統(tǒng)的安全余量就越大——多出幾十毫秒可能就是剎住與撞上的區(qū)別。

王傳福在發(fā)布會上給出的“兜底”承諾：

“在城市領(lǐng)航期間，只要你因為輔助駕駛導(dǎo)致的交通事故，比亞迪將全額賠付應(yīng)由本車承擔(dān)的經(jīng)濟損失，不設(shè)上限”。

不是比亞迪財大氣粗，而是底層技術(shù)架構(gòu)支撐起的信心。

專用NPU帶來的不只是低延遲。更高制程、更專用的架構(gòu)，讓璇璣A3在硬件層面具備了超越當(dāng)前L2輔助駕駛的能力邊界。配合比亞迪已經(jīng)布局的十重冗余架構(gòu)、超千線激光雷達、閃拍攝像頭等傳感器，它事實上已經(jīng)為L3/L4做好了準(zhǔn)備——只待法規(guī)落地，硬件能力就能直接釋放。

這就是專用NPU路線的核心價值：

不是去和通用GPU比誰的理論算力更高，而是用更少的晶體管、更低的功耗，跑出更多的有效計算；用為AI量身定制的硬件，去支撐更復(fù)雜的模型、更快的響應(yīng)、更高的安全上限。

璇璣A3的差異化，恰恰體現(xiàn)在這里。

王傳福這顆芯片，威力夠大嗎？

AI浪潮從汽車向更廣闊的物理AI延伸浪潮中，比亞迪不是第一個拿出自研底層算力方案的玩家。

但從更深遠(yuǎn)的技術(shù)、產(chǎn)業(yè)以及用戶角度，璇璣A3卻是迄今為止，威力最大、影響最深遠(yuǎn)的。

首先是對比亞迪自身來說，“全棧自研”，真正能做到從電池、電控到整車架構(gòu)再到智駕芯片全鏈路自研的企業(yè)屈指可數(shù)。

此之前，這個名單上主要是特斯拉、華為，以及部分環(huán)節(jié)上的蔚小理。現(xiàn)在比亞迪正式加入這個“夯爆了”名單。

但比亞迪與其他車企，尤其是以高舉AI旗幟的新勢力相比，護城河又更深一層：

同時擁有5座晶圓制造工廠、7000人芯片研發(fā)團隊、覆蓋13大類567款車規(guī)級芯片的產(chǎn)品矩陣，以及46個外部車企品牌。

任何車企都可以復(fù)刻座椅、空調(diào)、車燈的垂直整合，可以自研智駕算法，甚至也可以流片一顆芯片，但要在芯片設(shè)計、制造、封裝、測試全流程上同時具備這樣的規(guī)模和經(jīng)驗，能跟的玩家寥寥無幾——

這也同時意味著，智能化“普及”，比亞迪還有更多難以想象的殺手锏。

對用戶而言，這顆芯片帶來的不是紙面上的參數(shù)，而是更低的價格——全系可選裝城市領(lǐng)航，選裝價僅12000元；更安全的保障——官方兜底意味著事故賠償責(zé)任由車企承擔(dān)；

更流暢的OTA迭代——自研芯片使算法更新不再受制于供應(yīng)商的節(jié)奏。

跳出汽車工業(yè)，比亞迪的璇璣A3對于整個AI科技革命的發(fā)展，可能是改變其局的關(guān)鍵轉(zhuǎn)折。

自動駕駛芯片，或者廣義的AI計算芯片領(lǐng)域存在兩條路線之爭：通用GPU和專用NPU。

英偉達憑借CUDA生態(tài)和先發(fā)優(yōu)勢拿下了絕大多數(shù)的訂單。自研NPU則是少數(shù)實力玩家發(fā)現(xiàn)通用GPU不能滿足自身對技術(shù)極致探索的需求后，開辟的新戰(zhàn)場。

比如谷歌自研TPU用自己在數(shù)據(jù)中心的海量數(shù)據(jù)，驗證了ASIC路線在AI推理場景中的優(yōu)越性。

而比亞迪和谷歌唯一的區(qū)別是，谷歌的TPU跑在數(shù)字世界，比亞迪的璇璣A3跑在物理世界。

所以，比亞迪自研璇璣A3，不但是直接改變了GPU/NPU陣營力量對比的大事，更是專用AI加速器在物理AI場景中的首次超大規(guī)模驗證——這是比所有新勢力年銷量加在一起還要龐大的搭載規(guī)模。

從更廣的視角看，璇璣A3的意義超越了車載芯片的范疇。

它意味著，一家以電池起家的公司用24年的時間，完成了從能源到計算的全棧閉環(huán)。它意味著，中國車企在智駕芯片最高制程領(lǐng)域有了可以與英偉達正面對話的量產(chǎn)產(chǎn)品。

它更意味著，物理AI時代的底層基礎(chǔ)設(shè)施競賽已經(jīng)悄然拉開序幕。

璇璣A3的設(shè)計從一開始就兼顧泛化能力：它原生支持Transformer大模型，低延遲、高能效、高利用率——這些特性同樣適用于機器人、無人機、工業(yè)自動化等一切需要在物理世界中行動的AI。

具身智能的核心挑戰(zhàn)，是在物理世界中實時感知、推理、決策的能力——也就是一個具備高度理解認(rèn)知能力的大腦。

這要求計算平臺既要足夠快（低延遲），又要足夠省（功耗受限），還要足夠穩(wěn)定。而璇璣A3的架構(gòu)如果真的具備足夠的泛化能力，那么比亞迪手中握著的就不只是一顆智駕芯片，而是一個物理AI時代的通用計算平臺。

這也是王傳福所說說：整車智能就是具身智能。

當(dāng)人工智能從數(shù)字世界走向物理世界的關(guān)鍵節(jié)點，誰掌握了對物理世界進行感知、推理和干預(yù)的計算核心，誰就可能定義整個智能時代的入口。

回顧歷史，PC時代的標(biāo)準(zhǔn)計算單元是x86 CPU，移動互聯(lián)網(wǎng)時代是ARM SoC，AI時代初期是GPU。

那么物理AI時代的標(biāo)準(zhǔn)計算單元是什么？目前還沒有定論。

比亞迪正在用璇璣A3和年銷數(shù)百萬輛車的真實數(shù)據(jù)，試圖給出自己的答案。

特別聲明：以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布，本平臺僅提供信息存儲服務(wù)。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.