昨天華為正式提出了“韜(τ)定律”,在全行業(yè)引發(fā)了激烈討論。
關于韜(τ)定律的基本情況,我們已經在昨天的文章中進行了分析(不清楚的可以點進主頁查看)。關于韜(τ)定律和邏輯折疊技術本身,目前還缺乏一些必要的技術細節(jié)。
今天我們就一些公開的資料,來綜合分析一下韜(τ)定律會給接下來華為麒麟處理器帶來哪些新的改變。
![]()
關于韜(τ)定律,除了目前公布的一些官方信息之外,最權威和核心的資料,是華為半導體團隊負責人何庭波在中國科學院科技論文預發(fā)布平臺發(fā)表的一篇名為《A Time Scaling Theory for Multi-Layer Electronic Systems》(多層電子系統(tǒng)的時間縮放理論)的文獻。
華為團隊的韜(τ)定律,最核心的觀點就是,將半導體的核心考量指標從空間面積變成時間。
背后的邏輯很簡單:普通用戶買手機、用 AI,并不會在乎里面的晶體管到底是幾納米(空間)。用戶在乎的是:打開軟件快不快?大模型回復省不省時?這本質上追求的是時間概念。
此前半導體行業(yè)拼命把晶體管做小,本質上也是為了讓電信號少跑路,從而節(jié)省時間。
既然如此,為什么不把縮短時間作為追求半導體性能的終極目標呢?
這就是韜(τ)定律的核心邏輯。在全新的韜(τ)定律下,評價一款芯片性能的強弱將不再單看制程,而是要看整個計算系統(tǒng)內,完成一次任務需要耗費的時間(即時間常數(shù)τ)。 在此基礎上,華為半導體團隊拿出了最核心的一項技術,就是“邏輯折疊(Logic Folding)”。
![]()
這項技術的核心原理,昨天我們已經在文章中介紹過。簡單說,華為把原本平鋪在二維平面上的數(shù)字邏輯電路、模擬電路和內存,通過極為精密的技術垂直疊在一起。以前兩個晶體管要橫跨大半個芯片才能通信,現(xiàn)在就像“樓上樓下”,坐個電梯就到了。
在文獻中,華為詳細說明了邏輯折疊技術帶來的性能和能效紅利。
通過邏輯折疊技術,華為實現(xiàn)了在固定工業(yè)制程節(jié)點下空間利用率的突破。以采用了該項技術的 Kirin 2026(代號)為例,它的晶體管密度從上一代的 155 MTr/mm2 階躍式提升至 238 MTr/mm2,實現(xiàn)了 55% 的晶體管密度提升。
換句話說,在工藝制程不變的情況下,采用邏輯折疊技術的麒麟芯片,在同樣的物理尺寸下實現(xiàn)了 55% 的晶體管密度增長。而如果是要依靠傳統(tǒng)的提升工藝制程來實現(xiàn)同等晶體管密度的提升,行業(yè)通常需要耗費 3 年的研發(fā)周期。 新技術帶來了算力和能效的雙重提升。
![]()
通過縮短信號傳輸距離,減少了電阻電容浪費。華為 Kirin 2026 芯片實現(xiàn)了 13% 的最大時鐘頻率提升。華為在文獻中提到,Kirin 2026 芯片今年最高的核心運行頻率將提升至 3.1 GHz。相比之下,目前華為手機處理器最強的麒麟9030 Pro最高的核心運行頻率為2.75GHz。
與此同時,其 SoC 性能核心的功耗效率也提升了 41%。此外,通過后硅片時鐘偏斜調整方案,華為又獨立為 SoC 貢獻了超過 5% 的系統(tǒng)性能增益。
![]()
文獻還披露了這一技術路線帶來的 Kirin CPU 性能核心最高頻率的演進規(guī)劃趨勢:
- 2026 年(Kirin 2026):首次導入邏輯折疊架構,頻率達到 3.1 GHz(目前處于 Silicon 硅片階段);
- 2027 年(Kirin 2027):折疊架構升級,頻率推升至 3.39 GHz(處于 Silicon 硅片階段);
- 2028 年(Kirin 2028):頻率推升至 3.71 GHz(處于 Pre-silicon 預硅設計階段);
- 2029 年(Kirin 2029):頻率將正式觸及 4.0 GHz 門檻。
該文獻還明確指出,麒麟 2026 采用的邏輯折疊方案在工藝上還是相對保守的。隨著未來低溫鍵合等工藝的演進,技術將轉向完全體的三層、四層乃至更多層的全尺寸邏輯折疊。
在這一技術和理論的指導下,未來 3~5 年內麒麟處理器在用戶典型使用場景下,整體效率預計將實現(xiàn)一倍以上的增長!這將極大提升未來華為手機的性能和功耗表現(xiàn)。
還有一個被很多人忽視的細節(jié)就是,除了邏輯折疊技術之外,文獻中還有一項非常重要的技術,即:統(tǒng)一總線(Unified Bus)。該技術主要針對 AI 大模型算力集群和數(shù)據中心(大規(guī)模多芯片協(xié)同系統(tǒng))。
![]()
在傳統(tǒng)架構中,數(shù)據要在不同芯片之間傳輸,需要經過多層物理和軟件協(xié)議的轉換。每一層轉換都會帶來額外的序列化、DMA 緩沖區(qū)開銷和深層握手,帶來額外的時延和功耗。
Unified Bus (UB) 直接用一種統(tǒng)一協(xié)議,取代了上面整套復雜的傳統(tǒng)堆棧。這個協(xié)議不僅能在同一個機箱內跑,還能直接跨機箱在整個數(shù)據中心網絡里跑。
通過這一全棧式的重構,華為披露了 Unified Bus 帶來的性能提升:
端到端的遠程訪問延遲從傳統(tǒng) TCP/IP 類網絡軟件棧的幾十微秒(Tens of Microseconds),直接驟降到了大約 100 納秒(~100 ns)。在 AI 集群最核心的通信軸上,實現(xiàn)了高達 ~500 倍的系統(tǒng)時間常數(shù)(τ)壓縮。
另外通過該項技術,分布式機柜中的千百顆芯片通過 UB 緊密編織在一起,數(shù)據互連無損且無感知,使整個集群無限逼近一臺統(tǒng)一的、單體的算力中心。
總的來說,華為半導體團隊提出的“韜(τ)定律”是國產半導體領域一次非常重大的理論和技術突破。華為不僅拿出了全新的理論研究體系,還基于這一理論拿出來實實在在的應用技術。尤其是在當前摩爾定律紅利放緩,國產半導體存在“卡脖子”的背景下,華為這套理論體系和技術路線,不僅能夠極大提升國產芯片的整體性能,還為后摩爾定律時代半導體行業(yè)的多元化突圍,提供了一種全新的路徑。這是非常了不起的成就!
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.