璇璣A3來了:
中國第一顆車規(guī)級4納米智駕芯片,橫空出世:從自主研發(fā)、設(shè)計、測試完全自主完成。
![]()
三顆組合超2100 TOPS,但更重要的是對比通用GPU架構(gòu),單位功耗低20%,結(jié)合自研算法,深度優(yōu)化算力資源利用率提升100%。
算力榜上的TOPS不再是唯一的信仰。
AI汽車競爭,從“買誰家的芯片”、“多大算力”變成了“誰真正懂自己的芯片”。
而最令人意想不到的,第一顆4nm智駕芯片,竟然出自以前那個被認(rèn)為技能點全點在電動化的比亞迪——王傳福。
國內(nèi)最先進制程智駕芯片,出自比亞迪
璇璣A3采用4nm車規(guī)級制程,全球車載AI計算芯片中,是和英偉達Thor同處T0梯隊的級別。
其實自研計算芯片,無論從比亞迪自身技術(shù)實力、技術(shù)發(fā)展趨勢還是比亞迪一貫的垂直整合戰(zhàn)略出發(fā),發(fā)布會之就已經(jīng)是一個“公開的秘密”——不做,才是出人意料的big news。
![]()
但比亞迪最終拿出的產(chǎn)品方案,還是給了所有人震撼:
制程、算力除了此前的普遍預(yù)期——多數(shù)人推測比亞迪首款智駕芯片能對標(biāo)英偉達Orin(254 TOPS),或者地平線J6M,主要解決中低介輔助駕駛問題。
但璇璣A3直接邁向了Thor所在的段位,并且在先進制程這一項,領(lǐng)跑了中國玩家陣營。
更重要的,這顆芯片的自主研發(fā)、設(shè)計、測試全部由比亞迪自主完成,輔助駕駛?cè)溌房煽兀⑶乙呀?jīng)規(guī)模化量產(chǎn)。
我們總結(jié)了一張參數(shù)對照表:
![]()
解釋一下這些參數(shù)的實際含義。
制程大家最熟悉(4nm)決定了晶體管密度和能效,數(shù)字越小性能上限越高。王傳福給出的解釋是,車規(guī)級4nm的技術(shù)難度大致相當(dāng)于消費電子領(lǐng)域的2nm。
這句話并不是嚴(yán)格的技術(shù)定義,而是一句通俗易懂的類比,邏輯在于車規(guī)級芯片在同樣先進制程(如4nm)下,其設(shè)計與制造難度是一個跨越式的疊加。
因為車規(guī)級芯片不僅是“更高性能”的芯片,本質(zhì)上是 為“安全”而生的專業(yè)芯片,尤其是在4nm這樣的先進制程上,設(shè)計時必須引入大量的冗余設(shè)計和容錯電路、制造中也會使用更昂貴的材料,并增加特定的工藝步驟。
![]()
CPU部分為16核,420K DMIPS,負(fù)責(zé)全局調(diào)度和邏輯決策,這個算力足以同時處理智駕、座艙、車身控制的復(fù)雜任務(wù)。
內(nèi)存帶寬273GB/s,配合自研總線,硬件支持可納秒級低延遲。
單位算力功耗比同級產(chǎn)品低20%,意味著同樣計算任務(wù)下發(fā)熱更少、系統(tǒng)穩(wěn)定性更高。
算力利用率提升100%則是容易被忽視但非常關(guān)鍵的一點,這涉及到璇璣A3本質(zhì):NPU(神經(jīng)網(wǎng)絡(luò)處理單元),專為AI推理設(shè)計,而非從圖形渲染衍生而來的通用GPU。
通用芯片為了兼容多種客戶需求必然存在架構(gòu)妥協(xié),而璇璣A3針對比亞迪自研算法深度定制,使得同樣的理論算力能夠跑出兩倍的有效性能。
![]()
NPU的優(yōu)勢在于將矩陣乘法、卷積等AI常用算子直接硬化,同樣的晶體管面積能產(chǎn)出更高的有效算力。同時針對比亞迪自研算法肯定會深度定制,使得同樣的理論算力能夠跑出更高的有效性能。
自主最先進制程車載智駕芯片,的確夠重磅,但從算力本身來看,絕對數(shù)值不是No.1。
而真正讓璇璣A3區(qū)別于其他方案的,不在制程和算力,是能效和利用率上的差異化路線——大力出奇跡比拼理論峰值TOPS時,比亞迪把重心放在了“實際有效算力”上。
比亞迪的璇璣A3,能稱為AI汽車“芯皇”嗎?
技術(shù)路線上,璇璣A3選擇了專用NPU,而非英偉達Orin、Thor那樣的通用GPU衍生架構(gòu)。
GPU最早是為了做圖形渲染而生的,擅長同時處理海量相似的任務(wù)在黃仁勛的帶領(lǐng)下,英偉達把GPU變成了通用并行計算平臺,使得GPU不但可以做圖形相關(guān)的任務(wù),還可以做科學(xué)計算、數(shù)學(xué)分析以及AI訓(xùn)練。
這也是英偉達有如今江湖地位的根基。
![]()
而NPU中文叫神經(jīng)網(wǎng)絡(luò)處理器或者AI加速器。相比于GPU, NPU更加的注重 AI 相關(guān)的任務(wù)。
如果把GPU和NPU都看成工人的話, GPU就像經(jīng)驗更豐富一些的老師傅,會干很多東西,效率比較高。
NPU則是專門訓(xùn)練過的流水線工人,技能單一,但是專注的做一件事情且效率極高——高效運行AI模型。
通用GPU的優(yōu)勢是生態(tài)成熟、工具鏈完善、客戶接受度高,但代價是為了兼容不同車企、不同算法、不同模型,硬件資源必須保持一定的“靈活性”,這種靈活性是以面積和功耗為代價的。
![]()
它把矩陣乘法、卷積、激活函數(shù)等算子直接“硬化”,省去了圖形渲染和通用計算的冗余邏輯。同樣的晶體管數(shù)量,NPU能產(chǎn)出更高的實際算力;同樣的算力需求,NPU功耗更低。這就是璇璣A3單位算力功耗低20%、算力利用率提升100%的根本原因。
這種專用架構(gòu)帶來的體驗提升首先體現(xiàn)在削弱延遲上。
城市領(lǐng)航場景中,從傳感器采集到?jīng)Q策執(zhí)行,中間要經(jīng)過感知、預(yù)測、規(guī)劃、控制等多個環(huán)節(jié),每一步都涉及大量計算。算力不夠或架構(gòu)效率低,系統(tǒng)就會“猶豫”——被加塞、在復(fù)雜路口磨蹭、該繞行時不敢動。
璇璣A3的3核NPU原生支持Transformer大模型,能配合自研總線實現(xiàn)納秒級數(shù)據(jù)調(diào)度。發(fā)布會上展示的實測中,搭載璇璣A3的車輛在深圳坪山老街穿行,面對突然竄出的電動車、路邊臨停車輛、窄道多把掉頭等場景,表現(xiàn)出的是“絲滑”而非“機械”:
![]()
更低延遲還意味著更高的安全下限。人類的反應(yīng)時間約300到500毫秒,普通智駕系統(tǒng)可壓縮到100毫秒左右,而專用NPU可以進一步縮短這個窗口。反應(yīng)越快,留給系統(tǒng)的安全余量就越大——多出幾十毫秒可能就是剎住與撞上的區(qū)別。
王傳福在發(fā)布會上給出的“兜底”承諾:
“在城市領(lǐng)航期間,只要你因為輔助駕駛導(dǎo)致的交通事故,比亞迪將全額賠付應(yīng)由本車承擔(dān)的經(jīng)濟損失,不設(shè)上限”。
不是比亞迪財大氣粗,而是底層技術(shù)架構(gòu)支撐起的信心。
![]()
專用NPU帶來的不只是低延遲。更高制程、更專用的架構(gòu),讓璇璣A3在硬件層面具備了超越當(dāng)前L2輔助駕駛的能力邊界。配合比亞迪已經(jīng)布局的十重冗余架構(gòu)、超千線激光雷達、閃拍攝像頭等傳感器,它事實上已經(jīng)為L3/L4做好了準(zhǔn)備——只待法規(guī)落地,硬件能力就能直接釋放。
這就是專用NPU路線的核心價值:
不是去和通用GPU比誰的理論算力更高,而是用更少的晶體管、更低的功耗,跑出更多的有效計算;用為AI量身定制的硬件,去支撐更復(fù)雜的模型、更快的響應(yīng)、更高的安全上限。
璇璣A3的差異化,恰恰體現(xiàn)在這里。
王傳福這顆芯片,威力夠大嗎?
AI浪潮從汽車向更廣闊的物理AI延伸浪潮中,比亞迪不是第一個拿出自研底層算力方案的玩家。
但從更深遠(yuǎn)的技術(shù)、產(chǎn)業(yè)以及用戶角度,璇璣A3卻是迄今為止,威力最大、影響最深遠(yuǎn)的。
首先是對比亞迪自身來說,“全棧自研”,真正能做到從電池、電控到整車架構(gòu)再到智駕芯片全鏈路自研的企業(yè)屈指可數(shù)。
此之前,這個名單上主要是特斯拉、華為,以及部分環(huán)節(jié)上的蔚小理。現(xiàn)在比亞迪正式加入這個“夯爆了”名單。
![]()
但比亞迪與其他車企,尤其是以高舉AI旗幟的新勢力相比,護城河又更深一層:
同時擁有5座晶圓制造工廠、7000人芯片研發(fā)團隊、覆蓋13大類567款車規(guī)級芯片的產(chǎn)品矩陣,以及46個外部車企品牌。
任何車企都可以復(fù)刻座椅、空調(diào)、車燈的垂直整合,可以自研智駕算法,甚至也可以流片一顆芯片,但要在芯片設(shè)計、制造、封裝、測試全流程上同時具備這樣的規(guī)模和經(jīng)驗,能跟的玩家寥寥無幾——
這也同時意味著,智能化“普及”,比亞迪還有更多難以想象的殺手锏。
![]()
對用戶而言,這顆芯片帶來的不是紙面上的參數(shù),而是更低的價格——全系可選裝城市領(lǐng)航,選裝價僅12000元;更安全的保障——官方兜底意味著事故賠償責(zé)任由車企承擔(dān);
更流暢的OTA迭代——自研芯片使算法更新不再受制于供應(yīng)商的節(jié)奏。
跳出汽車工業(yè),比亞迪的璇璣A3對于整個AI科技革命的發(fā)展,可能是改變其局的關(guān)鍵轉(zhuǎn)折。
自動駕駛芯片,或者廣義的AI計算芯片領(lǐng)域存在兩條路線之爭:通用GPU和專用NPU。
英偉達憑借CUDA生態(tài)和先發(fā)優(yōu)勢拿下了絕大多數(shù)的訂單。自研NPU則是少數(shù)實力玩家發(fā)現(xiàn)通用GPU不能滿足自身對技術(shù)極致探索的需求后,開辟的新戰(zhàn)場。
比如谷歌自研TPU用自己在數(shù)據(jù)中心的海量數(shù)據(jù),驗證了ASIC路線在AI推理場景中的優(yōu)越性。
![]()
而比亞迪和谷歌唯一的區(qū)別是,谷歌的TPU跑在數(shù)字世界,比亞迪的璇璣A3跑在物理世界。
所以,比亞迪自研璇璣A3,不但是直接改變了GPU/NPU陣營力量對比的大事,更是專用AI加速器在物理AI場景中的首次超大規(guī)模驗證——這是比所有新勢力年銷量加在一起還要龐大的搭載規(guī)模。
從更廣的視角看,璇璣A3的意義超越了車載芯片的范疇。
它意味著,一家以電池起家的公司用24年的時間,完成了從能源到計算的全棧閉環(huán)。它意味著,中國車企在智駕芯片最高制程領(lǐng)域有了可以與英偉達正面對話的量產(chǎn)產(chǎn)品。
它更意味著,物理AI時代的底層基礎(chǔ)設(shè)施競賽已經(jīng)悄然拉開序幕。
璇璣A3的設(shè)計從一開始就兼顧泛化能力:它原生支持Transformer大模型,低延遲、高能效、高利用率——這些特性同樣適用于機器人、無人機、工業(yè)自動化等一切需要在物理世界中行動的AI。
![]()
具身智能的核心挑戰(zhàn),是在物理世界中實時感知、推理、決策的能力——也就是一個具備高度理解認(rèn)知能力的大腦。
這要求計算平臺既要足夠快(低延遲),又要足夠省(功耗受限),還要足夠穩(wěn)定。而璇璣A3的架構(gòu)如果真的具備足夠的泛化能力,那么比亞迪手中握著的就不只是一顆智駕芯片,而是一個物理AI時代的通用計算平臺。
這也是王傳福所說說:整車智能就是具身智能。
![]()
當(dāng)人工智能從數(shù)字世界走向物理世界的關(guān)鍵節(jié)點,誰掌握了對物理世界進行感知、推理和干預(yù)的計算核心,誰就可能定義整個智能時代的入口。
回顧歷史,PC時代的標(biāo)準(zhǔn)計算單元是x86 CPU,移動互聯(lián)網(wǎng)時代是ARM SoC,AI時代初期是GPU。
那么物理AI時代的標(biāo)準(zhǔn)計算單元是什么?目前還沒有定論。
比亞迪正在用璇璣A3和年銷數(shù)百萬輛車的真實數(shù)據(jù),試圖給出自己的答案。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.