![]()
![]()
用“繞過封鎖”的舊尺子,無法全面衡量評估一份“找到一個解法”的新答卷
文|吳俊宇 謝麗容
編輯 | 謝麗容
5月25日,華為半導體總裁何庭波發(fā)布的“韜(τ)定律”,震動半導體界和資本市場。
這次發(fā)布,回應了六年前華為創(chuàng)始人任正非的公開表態(tài)。2020年,華為被列入實體清單,幾乎從來不公開露面的任正非在當年頻繁接受中外媒體采訪,多次提到基礎研究,基礎教育,數學、物理,這些離當時幾乎接近斷供的華為公司其實很遠。
面對巨大危機,企業(yè)的本能反應往往是向外界傳遞立即可見的自救信號——調整供應鏈、爭取政策支持、發(fā)布替代方案。這些措施短期、即時,能夠有效穩(wěn)定內部軍心和外界信心。任正非反復強調的基礎研究命題,當時看來多少有點“不明覺厲”“遠水不解近渴”。
六年后回看,戰(zhàn)略和戰(zhàn)術閉環(huán)了。
5月25日,何庭波對我們說,華為內部有兩個“十年判斷”:第一,摩爾定律未來十年內將“撞墻”——即便沒有外部封鎖,先進制程的經濟與物理極限也會成為半導體全行業(yè)的共同約束;第二,2020年華為內部預判,邏輯折疊這一技術路徑需要十年才能取得突破。
實際進展比預想要快,何庭波團隊六年就做出成果。
何庭波,華為半導體業(yè)務部總裁、華為科學家委員會主任。2019年底,她在一封致海思全體員工內部信中提到,“今后的路,不會再有另一個十年來打造備胎然后再換胎了,緩沖區(qū)已經消失,每一個新產品一出生,將必須同步‘科技自立’方案。”
何庭波說,過去六年, 她有過沮喪的時候 。當先進制程的路徑被外力鎖死,而摩爾定律本身又正在全球范圍內撞上經濟與物理的雙重高墻,研究方向一度被逼入死胡同。
如何在半導體工藝制程難以突破的情況下,實現代際性能提升?轉機來自一座2000多年前的水利工程——都江堰。最難的時候,何庭波帶著團隊到都江堰散心。
沒有電,沒有圖靈力學,沒有現代機械,古人僅憑對“山、水、勢”的洞察,以無壩引水實現了自動分流、排沙、控流。她突然意識到:當外部約束無法改變,解決問題的關鍵不在于等待條件變好,而在于“要重新看這些(可利用的)條件,解決問題。”
“即便沒有出口管制,摩爾定律未來十年也將成為所有人的約束。華為只是提前在這個約束下工作。”何庭波反復強調一個更深層的產業(yè)現實:芯片制程來到7nm(納米)之后,每一代制程的設計成本、晶圓成本指數級攀升,單位晶體管成本下降的速度已不可逆轉地放緩。先進制程的經濟普惠性正在終結,換言之,全球半導體行業(yè)本就站在范式轉移的門口。華為不過是因封鎖而被提前推過了門檻。
“產業(yè)的必然”與“華為的緊迫”疊加效應,構成了韜定律誕生的雙重底色。
事實上,它更接近一份針對后摩爾時代的通用解題框架。這份框架是由一家被斷供的中國公司率先拿出,并且已經用381款量產芯片完成了可行性驗證。何庭波在演講后的溝通中強調:“如果今天依然能夠獲得最先進的EUV光刻機,我們是否還會走這條路?答案是不一定。但歷史沒有如果。恰恰是失去了選擇權,讓我們提前十年撞上了那個所有玩家最終都要面對的問題。”
![]()
產業(yè)的必然,華為的緊迫
即便沒有封鎖,摩爾定律也將在十年內撞墻,華為只是提前失去了選擇權
在何庭波看來,7nm之后,半導體先進制程的經濟基礎正在發(fā)生變化。
過去40年,摩爾定律之所以能夠持續(xù)推動整個半導體產業(yè)發(fā)展,并不僅僅因為晶體管數量持續(xù)增長。更重要的是,晶體管密度提升的速度長期快于制造成本上升的速度。這意味著,雖然芯片制造成本會增加,但單位晶體管成本仍在持續(xù)下降,技術進步所釋放出的成本紅利,能夠被整個產業(yè)鏈與消費者共享。
“過去摩爾定律最大的優(yōu)勢,是能不斷把技術進步帶來的紅利分享給整個產業(yè)界。但今天,先進制程本身已經越來越難繼續(xù)釋放這種紅利。”何庭波說。
她認為,在這種情況下,繼續(xù)依賴幾何縮微提升性能,將不可避免地進入“成本持續(xù)上升”的路徑。相比之下,τ(韜)定律并不單純依賴更昂貴的先進晶體管,而是通過邏輯折疊技術手段,提升晶體管密度,實現器件、電路、芯片和系統的延遲和性能優(yōu)化,從而實現半導體與電子系統的持續(xù)演進。
摩爾定律近三年帶來的經濟收益在逐漸放緩。這也是目前半導體行業(yè)公認的一個問題。半導體行業(yè)近五年有大量學術研究。
國際頂級學術期刊《科學》2020年6月刊載了麻省理工學院教授、圖靈獎得主查爾斯·E·萊瑟森(Charles E. Leiserson)和英偉達、微軟等研究員共同發(fā)表的一篇論文——《摩爾定律之后,什么將驅動計算性能繼續(xù)提升?》(《There’s Plenty of Room at the Top: What Will Drive Computer Performance after Moore’s Law?》)。
這篇論文的核心觀點是,“后摩爾時代”計算性能的提升,將越來越依賴軟件、算法、系統架構與專用硬件協同優(yōu)化,而不再主要依賴晶體管尺寸持續(xù)縮小。
和上述觀點類似,華為內部的判斷是,摩爾定律將在十年后“撞墻”。
雖然先進制程仍然能夠持續(xù)提升晶體管密度、性能與能效,但每一代制程節(jié)點所需要付出的設計成本、制造成本與資本開支正在快速上升。尤其是在半導體工藝進入5nm、3nm乃至2nm階段后,先進制程的成本在顯著提高。
國際半導體咨詢機構IBS(International Business Strategies)2022年數據顯示,7nm芯片設計成本約為2.49億美元,5nm約為4.49億美元,3nm約為5.81億美元,2nm約為7.25億美元。
國際半導體智庫安全與新興技術中心(CSET,Center for Security and Emerging Technology)研究顯示,臺積電7nm 300mm晶圓成本約為9346美元,5nm約為16988美元。國際半導體市場調研機構 TrendForce數據則顯示,3nm晶圓價格已達到約2.5萬—2.7萬美元,2nm約為3萬美元。
![]()
![]()
摩爾定律過去的性能提升與單位成本同步下降的行業(yè)普惠效應,正在不可逆轉地持續(xù)減弱。進入先進制程時代后,只有少數頭部晶圓代工廠,以及蘋果、英偉達等少數能夠承擔下一代芯片研發(fā)與量產成本的科技公司,仍能持續(xù)享受先進制程帶來的性能與能效紅利。
只是對華為來說,這件事情來得更早。2019年被列入“實體清單”后,華為被迫開始嘗試尋找另一條路線——不再只是追求單位面積內晶體管數量的增加,而是通過降低系統中的“時間成本”繼續(xù)提升性能。在這種背景下,韜(τ)定律誕生了。
需要厘清的一個理論事實是,韜(τ,也就是tau,也被稱為時間常數)這一概念并不是華為首次提出。
在電子學與半導體領域,τ長期被用于描述電路中的時間延遲,以及RC(電阻、電容)特性對信號傳播速度的影響。過去幾十年,圍繞降低時間延遲,半導體行業(yè)已經積累了大量研究,包括互連優(yōu)化、時序優(yōu)化、先進封裝、近距通信、異步計算與數據流架構等方向。它們的共同目標,都是降低信息在器件、電路、芯片與系統中的傳播時間成本。
多位芯片工程師對我們提到了他們對韜(τ)定律的看法。他們提到,以降低時間延遲為核心的優(yōu)化思路在行業(yè)內并非全新概念。此前,HBM(高帶寬內存)的3D堆疊、AMD倡導的混合鍵合(Hybrid Bonding)等技術,已經在不同程度上實踐了這一方向。
一位芯片工程師提到,HBM在垂直方向上堆疊多個DRAM(動態(tài)隨機存取存儲器)重疊封裝的3D技術、AMD公司現在倡導Hybird Bonding(混合鍵合,通過銅對銅直接金屬連接與二氧化硅等介電材料)都采取了類似思路。
不過,在摩爾定律長期持續(xù)有效的階段,這些技術更多被視為工藝制程下降的輔助優(yōu)化,并不是產業(yè)演進的核心主線。華為的特殊之處在于,第一次提出要把“韜(τ)定律”作為演化主要方向。
2019年被列入實體清單后,面臨全面斷供的華為公司不得不嘗試另一條路線——不再只追求單位面積內晶體管數量的增加,而是通過降低系統中的“時間成本”繼續(xù)提升性能。
韜(τ)定律始于芯片又不止于芯片。何庭波尤其強調韜(τ)定律帶來“Cost Effective”(經濟性)。它不依賴于EUV等先進制程,而是通過器件、電路、芯片、系統等各層級的時間常數優(yōu)化,降低對高成本制造工具的依賴。
它的完整設想是,從晶體管、電路、芯片、系統等各個方面把“降低τ”作為統一優(yōu)化目標。具體來說,在晶體管層降低開關延遲,在電路層降低RC傳播延遲,在芯片層降低計算與訪問延遲,在系統層降低同步與通信延遲。
因此,韜(τ)定律還被運用在更大的計算系統內——它包括超節(jié)點甚至是算力集群。
計算始于芯片晶體管的電流和數據傳輸。數千億個晶體管被蝕刻在一枚芯片上,它們控制信號開關。一枚芯片再通過封裝技術與HBM等器件連接在一起。數十枚芯片被部署進一個服務器機柜,多個機柜組成一個超節(jié)點,成百上千個超節(jié)點進一步連接成大規(guī)模算力集群。從晶體管的信號傳輸,到算力集群的高效吞吐Token(詞元),整個過程本質上都是在縮短數據與信息的傳輸時間。
算力,早已經不只是通過芯片這個單點提升,而是需要依靠系統工程才能全面提升。
![]()
為什么是麒麟芯片?
手機芯片單位面積和功耗預算極為有限,物理約束使手機SoC的設計難度遠高于AI算力芯片。如果麒麟能做到,將是最好的驗證
華為手機中搭載的麒麟系列芯片是最早用邏輯折疊改造的芯片之一。2026年下半年將在華為旗艦手機上搭載的麒麟2026就是基于韜(τ)定律改造的芯片,它已經實現了量產。
根據華為方面披露的信息,麒麟2026晶體管密度提升53%,主頻提升接近13%。
何庭波在中國科學院科技論文預發(fā)布平臺上發(fā)表的署名論文《多層電子系統的時間縮微理論》(A Time Scaling Theory for Multi-Layer Electronic Systems)顯示,麒麟2026的性能提升,過去需要“三年的幾何縮微”才能實現。
在這篇論文中,何庭波給出了麒麟系列芯片未來幾年的路線圖——麒麟CPU性能核心頻率正從過去依賴平面(Planar)架構的小幅提升,轉向依賴LogicFolding(邏輯折疊)的三維集成路線。
2023年-2025年,麒麟9000s、麒麟9020與麒麟9030 Pro主頻分別為2.6GHz、2.65GHz與2.75GHz。但從2026年開始,采用邏輯折疊技術的麒麟芯片主頻預計將提升至3.1GHz,并在2029年進一步邁向4GHz。
華為官方目前并沒有披露這些芯片未來所對應的工藝制程。
但華為相關人士對我們表示,在不單純依賴傳統幾何縮微的情況下,麒麟芯片的性能與能效比仍在繼續(xù)提升。但是和傳統工藝制程直接對比,并不符合韜(τ)定律的發(fā)展路徑。“降低τ”才是后續(xù)演進的關鍵。
![]()
按照何庭波的說法,“降低τ”的關鍵技術是邏輯折疊。
邏輯折疊,指的是把原本在一塊die(裸片)上展開的邏輯電路,重新切分在上下兩層裸片中進行高密度的邏輯設計。它需要關鍵路徑、時鐘樹、數據總線一起參與重新設計,進而讓兩層共同構成一個統一邏輯系統。
這種做法的核心目標是縮短信號傳播時間,而不只是增加封裝密度。它更接近于把一個邏輯系統折疊成立體結構,而不是簡單地把兩個芯片堆疊或連接。
何庭波認為,一個常見誤解是,把邏輯折疊和2.5D/3D封裝或其他技術混為一談。在她看來,Folding(折疊)與Stacking(堆疊)并不相同。堆疊更像是多個模塊的封裝連接,而折疊則更像是將一個原本平面的邏輯系統,在三維空間中重新設計。
華為半導體首席科學家廖恒解釋,邏輯折疊的關鍵在于上下兩層die之間形成了高密度的垂直互聯。以麒麟2026芯片為例,華為在兩層die之間提供了約5000萬個連接,其中約500萬-1000萬個被用于信號通信,遠高于3D封裝中兩個die之間幾萬至幾十萬個連接的量級。
目前,當前行業(yè)主流2.5D/3D封裝的做法是先完成獨立芯片設計,再將不同裸片連接在一起。裸片之間的Hybrid Bonding(混合鍵合,在極小空間內實現極高密度、低功耗的三維芯片堆疊)間距通常在7微米-10微米。
但邏輯折疊通過約2微米的鍵合間距,以及極小的Gear Ratio(die內部金屬層互連尺度與die間鍵合尺度之間的比例),實現了接近芯片內部互聯級別的垂直連接,而不只是傳統意義上的封裝堆疊。
為了簡單說明邏輯折疊與傳統2.5D/3D封裝的差異,廖恒打了一個“電梯”的比方。
他把邏輯折疊上下兩層die之間的連接,形容成兩座城市之間的電梯系統。在當前主流2.5D/3D封裝技術中,兩層die之間通常只有幾萬到幾十萬個連接,類似于“兩座城市之間只有幾萬部電梯”。但在麒麟2026的邏輯折疊設計中,相當于兩座城市之間,擁有了500萬到1000萬部真正運送信息的電梯。
![]()
麒麟2026上的邏輯折疊示意圖
一位半導體工程師提到,從目前華為披露的信息來看,邏輯折疊的特色是,在于從電路布線與互連結構等多個層面,盡可能縮短信號在不同門電路之間的傳播路徑。
在傳統平面芯片中,如果兩個邏輯模塊距離較遠,信號就要經過更長的金屬走線,RC(電阻、電容)時延也會隨之增加。邏輯折疊看起來是將二維平面的電路結構轉向立體堆疊,通過垂直互聯替代部分長距離平面布線,這可以縮短關鍵路徑的信號傳播時間。
他進一步解釋,如果這種優(yōu)化能夠在大量基礎電路單元中持續(xù)實現,就意味著芯片內部可以不斷節(jié)省時間預算,逼近先進制程所帶來的部分性能收益。
那么,邏輯折疊與傳統2.5D/3D封裝差異,在芯片制造的具體實踐上有哪些實際差異?
我們查閱英偉達官網了解到,英偉達近兩年熱銷的GB200芯片系統由兩枚B200 GPU和一枚Grace CPU通過NVLink-C2C 高速互連和2.5D/3D混合封裝技術集成為一個超級芯片系統。其中B200芯片由兩塊完整的GPU die通過硅橋超高密度連接而成。
英偉達GB200芯片和華為的麒麟2026芯片被用于完全不同的業(yè)務場景。前者被用于數據中心,后者被用于手機,兩者不能隨意混為一談。但在技術原理上可以對兩款芯片的die連接方式進行區(qū)分。
但目前各家披露的技術上看,英偉達GB200芯片更像是通過先進封裝與高速互聯把兩個超大GPU拼接起來,華為的麒麟2026芯片更像是在邏輯系統上重新組織電路、時鐘樹與信號路徑,讓上下兩層die共同構成一個統一邏輯系統。
需要強調的是,麒麟之前,華為已經基于“韜(τ)定律” 設計并量產了381款芯片,和它們不同,麒麟芯片是對外公開驗證的第一站,對于華為公司來說本質上是一次“壓力測試”。
用最難的芯片,接受最大面積的用戶驗證,這或許基于華為的三重戰(zhàn)略考量。
其一,以消費端高端旗艦產品的商業(yè)化落地,向上下游產業(yè)鏈、投資市場與行業(yè)生態(tài)釋放確定性信號,最大化提振產業(yè)鏈和學界信心,加入新路線的研究和研發(fā)中;
其二,依托麒麟極限場景的打磨,將前期數百款芯片的量產經驗系統化、標準化,沉淀出一套可復制、可遷移、可通用的三維邏輯設計方法論,完成從單點技術突破到體系化工程能力的躍遷,為后續(xù)全品類芯片的性能升級與批量國產替代筑牢核心工程底座;
其三,提前預埋產業(yè)生態(tài)迭代伏筆,牽引EDA工具、制造工藝、封裝測試、系統適配等整條產業(yè)鏈協同升級,為后續(xù)大規(guī)模、全方位的國產化替代與產業(yè)范式轉型鋪平道路。
簡單說,基于“韜(τ)定律”的新芯片設計路線,要完成從“技術備胎”到“產業(yè)新標準”的戰(zhàn)略升級,麒麟是最適合的公開驗證第一芯。
![]()
一家公司做不完,整個行業(yè)一起走
“韜(τ)定律”的真正意義,不在于它宣告了一個“換道超車”的神話,而在于它揭示了一個被封鎖提前催化,卻最終屬于整個產業(yè)的命題
“韜(τ)定律”從被提出,到被半導體行業(yè)普遍認可和接受還有很長的一段路要走。
華為內部的態(tài)度是,韜(τ)定律和邏輯折疊,不可能依靠單家公司完成,它需要工具鏈、制造鏈、封裝鏈、系統鏈共同演進,最終形成產業(yè)共識與生態(tài)協同。
何庭波的態(tài)度是,韜(τ)定律不是華為一家公司能完成的,未來十年“沒有一個公司能完成所有答案”,何庭波坦言,這需要學術界、工業(yè)界共同參與和探索。邏輯折疊并不只是封裝技術變化,它對芯片前端(Front End)與后端(Back End)的設計方法論(Design Methodology)都提出了新的要求。
過去六年,華為已經嘗試開發(fā)部分內部工具(In-house Tool),但距離成熟仍有很大空間。何庭波認為,“如果沒有整個Design Methodology,包括Tool Chain(工具鏈)的支持,是非常難以完成的。”因此,華為選擇在ISCAS 2026這個學術會議上公開這一技術路線,希望吸引更多學術界與產業(yè)界共同參與。
以EDA(電子設計自動化)工具為例,它是芯片設計必不可少的一環(huán)。
華為無線終端芯片及解決方案首席架構師黃勇甚至認為,邏輯折疊從理論或概念走向實際產品,整個工具鏈是最大的挑戰(zhàn)之一。
因為,傳統芯片設計長期建立在二維平面設計基礎之上,而邏輯折疊需要重新處理跨層邏輯劃分、時鐘樹、數據總線以及供電與熱管理等問題。
黃勇介紹,華為目前在傳統EDA能力之上,疊加內部自研工具、外部伙伴協作以及人工參與的工程方法,率先實現部分邏輯折疊收益。但如果想把邏輯折疊的“全部收益”拿出來,需要對傳統工具發(fā)生“Fundamental(根本性)改變”。
行業(yè)生態(tài)的吸引力則需要實戰(zhàn)成效驗證。一位半導體工程師表示,華為公布韜(τ)定律之后,他仍持觀望態(tài)度,他希望看到下半年華為麒麟2006的實際性能表現。另一位半導體工程師的態(tài)度是,半導體工藝和制造的突破,一定都靠數量、時間堆出來的。
當我們問到,英偉達的Nvlink 72芯片互聯技術、HBM垂直疊加多層DRAM等方式能否被認為是降低時間延遲時,廖恒認為,在過去50年間,降低時間延遲這個思路一直是存在且應用的。每一次有了新的節(jié)點的技術,都是改進了時間,這就是結果,但不代表技術本身的意圖就是為了改進這個時間。
廖恒強調,在傳統路徑下,每當行業(yè)想獲得更高性能時,第一反應永遠是幾何縮微。這已經形成了一種路徑慣性(Momentum Inertia)。但如果從指導原則層面,把時間作為核心目標去思考,會發(fā)現新的東西。因為當意圖變了,就會從不同角度去尋找解決方案。
解決問題的過程是整個產業(yè)共同努力的結果。世界上沒有任何一家公司或者任何一個超級科學家可以解決所有的問題。
廖恒認為,摩爾定律提出60年之后,半導體行業(yè)的問題并沒有結束。整個行業(yè)一直是摸著石頭過河,碰到一個問題解決一個問題。這是整個產業(yè)共同努力的結果。韜(τ)定律未來面對的情況也是類似的。
5月26日,北京大學集成電路學院團隊宣布在面向邏輯折疊的“真3D”EDA方向取得關鍵突破,提出區(qū)別于傳統“贗3D”堆疊的真三維設計流程,支持標準單元級跨die劃分與三維空間協同優(yōu)化,可顯著縮短線長、改善時序并優(yōu)化散熱,直接補齊邏輯折疊從架構創(chuàng)新走向工程化、規(guī)模化最關鍵的工具鏈短板。
簡單說,北大團隊突破了適配華為邏輯折疊的專用設計工具,打破了傳統堆疊只能拼整塊芯片的局限,現在能把芯片最基礎的電路單元自由拆分、立體排布,大幅提速、降延遲、優(yōu)化散熱,補上了邏輯折疊技術大規(guī)模量產最缺的工具短板。
從2019年“備胎轉正”到2026年“韜定律公開”,華為的戰(zhàn)略重心完成了從“替代”到“定義”的位移。這種位移的本質,是在摩爾定律普惠性終結、先進制程經濟門檻持續(xù)抬升的產業(yè)拐點上,率先交出一份系統性的解題框架。
能否從“華為的路線”演進為“產業(yè)的標準”,取決于三個變量的協同演化:EDA工具鏈能否完成從2D到3D的根本性重構,設計方法論能否跨越平面時代的路徑依賴,以及產業(yè)鏈上下游是否愿意在新坐標系中重新校準各自的技術路標。北大的EDA突破是一個積極的信號,但距離形成完整的生態(tài)閉環(huán),仍有大量工程空白需要填補。
當我們問到,學界和產業(yè)鏈對華為邏輯折疊技術的迭代支持,還有哪些是需要去攻破,時間還有多久時,何庭波回答:“確實各個方向上都會有困難和挑戰(zhàn),但這條路應該是通的,時間是我們的朋友。”——在半導體行業(yè),這句話的另一種表述是:沒有捷徑,只有積累。
![]()
![]()
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.