AI基礎設施的軍備競賽正在將供應鏈壓力從芯片本身向外蔓延,覆蓋光學器件、電源半導體乃至數據中心外圍的電網管理設備。在HBM短缺和算力擴張已被市場廣泛定價之后,新一輪供應瓶頸正在更隱蔽的環節悄然成形。
周六,AI圈研究博主Chris Barber與知名匿名分析員@bubbleboi討論了AI供應鏈瓶頸與基礎設施問題,系統梳理了AI供應鏈各層級的緊張程度,并點名了多個尚未被市場充分認識的潛在爆發點。
![]()
在@bubbleboi的排序中,磷化銦(indium phosphide)相關的激光與光學器件已是"完全的災難",DRAM/HBM短缺持續惡化,而電源半導體雖然目前尚不構成瓶頸,卻是他最看好的"下一個爆發"方向——尤其是數據中心外圍的固態變壓器市場。
磷化銦:當前供應鏈的“災難級”瓶頸
磷化銦是他措辭最為激烈的一個環節。"磷化銦的情況非常非常非常糟糕,"@bubbleboi表示,"很多人還沒意識到有多嚴重。"
問題的根源在于CPO(共封裝光學)技術的推進對激光器提出了更高要求——更高功率意味著更大的芯片面積,更窄的線寬和更好的噪聲性能同樣推高了對磷化銦晶圓的需求。與此同時,磷化銦的加工鏈條——從礦石到晶體、再到外延片、最終到激光器印刷——每一個環節都處于嚴重供不應求的狀態。
這一短缺正在重塑光收發器市場的格局。
傳統上,每一代收發器(如400G、800G)在初期以EML(磷化銦單片集成調制器)為主,隨后逐步向硅光子(SiPho)遷移以降低成本。但這一次,1.6T收發器幾乎從一開始就由硅光子主導——原因正是EML供應的嚴重短缺,以及制造商將產能向利潤率更高的連續波(CW)激光器傾斜。
DRAM與HBM:三家寡頭全線爆滿
內存是@bubbleboi排名第二的供應瓶頸。
他的核心判斷是:全球只有三家公司能夠生產DRAM——SK Hynix、三星和美光——三家均已滿負荷運轉,短期內沒有新產能上線的可能。
圍繞HBM4的技術路線之爭,他認為市場過度解讀了其中的戲劇性。SK Hynix選擇臺積電12納米制程制造HBM4基礎芯片,三星使用自研SF4X邏輯節點,而美光堅持沿用內部DRAM制程,導致進度落后。
但他認為這些差異對財務影響有限:"三家都會以相當高的毛利率賣光所有產品,誰在乎呢?"他補充說,即便美光HBM4未能進入英偉達Rubin平臺,也可以將產品賣給其他客戶,或以高價出售普通DRAM。
他將DRAM和HBM視為同一類別,并表示相比NAND閃存,他更偏好DRAM,原因是NAND更容易出現供過于求的情況。
“電網保衛戰”:AI盡頭的固態變壓器與功率半導體
相較于已經被市場高度關注的算力芯片內部競爭,分析師將最大的“想象空間”留給了數據中心之外的電力交付系統。
AI數據中心對電網構成了前所未有的挑戰。當幾萬到十萬張GPU在訓練間隙停止計算、進行互聯通信時,電網負載會發生劇烈的波動。“這對電網運營商來說是一個‘惡魔般的噩夢’(satanic nightmare)。”
訪談中披露了一個極具戲劇性的細節:
去年PyTorch團隊甚至在代碼中加入了一個名為“Power Plant No Blow Up(發電廠別爆炸)”的特殊標志。其作用是,當GPU不需要做數學運算時,強迫它以最大速度進行“垃圾計算”。
“假設你的芯片正常運行需要500瓦,不工作時本應降至200瓦。但現在不行,必須全程保持500瓦,因為我們不能讓電網運營商生氣。”負載的劇烈拉扯會反向傳播并破壞電網穩定,這也是許多AI數據中心拿不到電力許可證的核心原因。
為了解決這一痛點,基于碳化硅(SiC)和氮化鎵(GaN)等寬禁帶材料的“固態變壓器”正迎來產業拐點。傳統變壓器體積龐大且完全是被動器件,交付周期長達12到18個月;而固態變壓器雖然昂貴,但可以通過晶體管進行動態“負載調節(Load regulation)”。 “你可以動態編程,確保兩側的電流和電壓基本一致……電網運營商會更高興,你也能拿到供電許可。”
分析師預測,這項技術將在未來36個月內起飛,相關功率半導體公司(如Wolfspeed以及部分從光伏逆變器轉型的公司)雖然目前處于周期低谷甚至虧損,但在AI電力調節需求的驅動下,具備極大的重估彈性。
邏輯晶圓與先進封裝:邊際改善,但仍緊張
相比磷化銦和內存,@bubbleboi認為邏輯晶圓的情況在過去六個月有所改善。
臺積電產能依然緊張,但三星先進邏輯產線的利用率已從接近零回升,英特爾也開始接受外部客戶。
他認為先進封裝(CoWoS、EMIB)的緊張程度將低于市場預期,部分原因是英特爾在馬來西亞的產能正在擴張,且臺積電更傾向于將潔凈室空間用于毛利率更高的N3制程。
CPU短缺與另類加速器:被忽視的隱患
@bubbleboi將CPU列為"大問題",認為其短缺程度超出市場認知。
AMD面臨GPU與CPU爭奪臺積電產能的兩難困境,ARM自身沒有晶圓配額,而他認為唯一有能力填補缺口的是高通——因為安卓手機需求下滑導致高通在臺積電有閑置產能,可以轉產數據中心CPU。但他對高通能否成功持懷疑態度,"他們已經失敗了三次"。
在另類加速器領域,他對Positron和Cerebras持正面看法,但對Cerebras有明確批評:仍在使用FP16而非FP4是"愚蠢的錯誤",IO設計限制了KV緩存卸載能力,且封裝良率可能僅在20%至40%之間。
對于Taalas,他認為其將權重硬編碼進芯片層的工程設計"非常非常聰明",可將芯片設計周期從一年以上壓縮至兩到三個月,且無需HBM或任何先進封裝,成本極低。但他對其商業前提持懷疑態度——AI模型權重更新頻率極高,而Taalas要求50%至90%的權重固定不變,"我不認為AI公司會接受這個前提"。
最后,當被問及“如果你是黃仁勛,你會試圖鎖定什么供應鏈”時,分析師的一句原話為目前的AI硬件競爭做出了注腳:“他已經鎖定了所有東西的產能。我本來想說光纖,但他已經去跟康寧談交易了。我認為這個人是神(the man is a god),他已經把能鎖定的全都鎖定了。”
以下是采訪問答文字實錄(由AI協助翻譯)
Chris:三到五年后,哪些替代性加速器可能會承擔非常大量的訓練或推理任務?
@bubbleboi:訓練方面,我認為它們基本上都不行。推理方面,我非常看好Positron和Cerebras,但原因截然不同。還有誰呢?MatX。問題是我沒有足夠的信息。所以它可能不錯,但我對他們一無所知。所以簡單回答就是Positron和Cerebras。還有Taalas,我不太相信他們的前提,但這很酷,我有點想為他們宣傳一下,因為如果前提成立,那將非常驚人。但我認為AI領域的人不會容忍這個前提。是的,這些是我真正喜歡的三巨頭,MatX在旁邊,因為我不夠了解。我仍在努力讓他們同意和我談談。
Chris:你不同意的Taalas的前提是固定權重?
@bubbleboi:他們正在做的是使用上層掩模層來燒錄權重。一旦你有了權重,就無法更改。鑒于AI模型變化如此之快,比如每兩周就有GPT 5.5,然后是5.6。如果你和這些公司工作的人聊聊,模型內部在 constantly 變化。模型末尾有個十六進制數。每隔幾周就有更新。權重在不斷變化和微調。
Taalas表示他們支持微調。我認為他們的意思是,當前芯片支持對權重進行一些修改,但遠未達到你想要的那么多。他們當前的芯片是三分之二硬編碼權重,三分之一只是SRAM機器。他們能支持微調的原因是那三分之一是SRAM,你可以更改或微調一部分權重,或者做LoRA之類的事情。他們基本上是在跟客戶說,你的模型硬編碼越多,運行得就越快,但你需要做出權衡。在理想情況下,有人可以設計一個模型,其中90%的權重是硬編碼的(我隨便說的數字)。它會運行得超級快。然后10%用于LoRA或更新權重。我不知道是否有大客戶會接受這種程度的限制。我認為不會。但Taalas背后的工程實際上非常非常聰明。
他們使用上層掩模層。現在的芯片大概有14層,姑且說是14或15層。他們用上層三分之一中的一層來編程和硬編碼權重。所以你想一下,通常芯片設計最少需要三個月,通常更久,然后需要流片,再過五六個月芯片才能回來,然后還得驗證。Taalas不得不為他們自己的編譯器、驗證棧和芯片設計制作了一堆定制EDA工具,他們聲稱一天之內就能完成一個新模型。最終目標是。目前大概需要一周。所以設計需要一周,然后因為他們只更改上層,其中一層,他們可以儲存晶圓。所以如果你去臺積電或任何晶圓廠,這在行業里很常見,你可以說,嘿,我希望你們把X數量的晶圓保持在70%的完成度,先別完成最后一部分,因為我們正在做研發之類的。所以Taalas的周轉時間比我最初預期的要快得多。新設計需要一周,然后大概兩個月。這是我的估計,肯定不是六個月。所以兩個月內你就能拿回芯片并運行它。他們聲稱他們制作了一些非常聰明的Verilog編譯器工具和線程仿真工具,與標準EDA工具對接,以很好地驗證一切。所以后硅驗證應該沒問題,因為芯片的基礎設施已經驗證過了,你只是改變權重。他們把原本至少一年的流程從開始到結束,理論上縮短到了兩三個月,這還不錯。
從模型架構的角度來看,我更像一個硬件人。我不太懂模型架構。我努力想弄明白,好吧,如何實現大部分權重固定,只改變一部分權重,比如單層中的權重之類的。然后我發現了LoRA,我問了那些真正懂AI的人,他們告訴我,哦不,LoRA不能擴展之類的。這很蠢。只有失敗者才用LoRA。但如果前提確實成立,如果他們找到一個愿意使用LoRA或其他算法的客戶,其中很大一部分權重是固定的,并且我們會 constantly 服務這個模型,這樣才經濟,那么Taalas的經濟效益將是驚人的。芯片非常便宜。它不需要任何HBM或任何類型的內存。不需要任何類型的先進封裝。即使是PCB,他們在芯片到芯片通信上受到延遲限制,完全沒有帶寬限制。所以他們使用PCIe和CXL,他們目前的主要限制是他們的芯片上沒有最新版本的CXL,顯然CXL 3.0提供的一些功能會對他們有實質性的幫助。但他們目前也還好。所以你將擁有驚人的、不可思議的性能(在其他任何架構中都不可能實現),而且價格極其便宜。只是有這樣一個限制:很大一部分權重,可能在50%到90%之間,需要是固定的,你不能更改它們。要更改它們,你將不得不扔掉所有或大部分芯片,然后等待兩到三個月,而新設計的成本大約是25萬美元。
拿Taalas的CEO來說。他在一次采訪中說,新版本芯片的設計成本“相當于一臺H100服務器”。假設你運營一個數據中心,用Taalas芯片服務某個模型,你決定扔掉所有Taalas芯片,因為模型需要更新。所以你必須注銷這筆資本支出,付給Taalas額外的30到50萬。最壞的情況是,他們在兩三個月內為你制造新芯片,然后你部署它們。再說一次,沒有內存問題。甚至沒有PCB問題。你可以使用低質量的PCB材料,因為它們只是運行非常慢的PCIe。所以這可能行得通。我只是對模型了解不夠,看不出它是否真能行得通。
Chris:在堆棧的不同層面中,你認為未來幾年哪些最終會面臨最嚴重的供應限制?
@bubbleboi:是的,幾乎所有。如果你在一月或二月問我,我會給出截然不同的答案,但現在 所有 都受限。
Chris:為什么市場從去年九月左右開始對此瘋狂?
@bubbleboi:我不明白這點。有時候市場真的很奇怪,我跟很多對沖基金的人聊,我會說,你們很聰明,為什么現在才意識到這個?很奇怪。
Chris:宏觀觀點是不是大家都開始明白了,好吧,超大規模企業的資本支出將繼續增加,至少絕對值上會增長?
@bubbleboi:是的,宏觀情況是人們不斷地來回搖擺。我給你舉個有趣的例子。有人告訴我,傳統能源投資者都在做空Bloom,因為他們覺得,哦,Bloom太貴了,天然氣渦輪機更便宜,這是個泡沫。我說,哥們,這是關于通電時間的問題。你們完全錯過了重點。
Chris:他們不了解這類客戶面臨的限制。
@bubbleboi:我知道。你不明白人們為什么選擇這個。不是因為更便宜。每兆瓦的經濟性可能差很多。但你現在就能擁有它。如果你必須將數據中心項目推遲至少六個月,……我跟更多專注于AI和半導體的對沖基金聊過,他們說,哦,我們知道其他那些做空Bloom的能源對沖基金。為什么要自尋死路做空這個?金融世界里有很多奇怪的事情。所以我無法解釋。
Chris:哪些其他層面最終會成為瓶頸?
@bubbleboi:磷化銦情況非常糟糕。簡直不可思議。我不知道很多人會怎么辦,但任何與磷化銦相關的事情都真的、真的、真的很糟糕。
磷化銦用于激光器和光學器件,因為硅無法產生光。人們仍然不明白情況有多糟,因為CPO對激光器的噪聲性能提出了更高的要求。
Chris:比如Aixtron?
@bubbleboi:哦,是的。所以他們制造用于磷化銦生產的設備。他們某種程度上不是瓶頸,嗯,他們可能是,但他們正在制造更多的機器,而像Lumentum、Coherent和Sumitomo這些公司正在購買這些機器。我做多這些。更像是Lumentum和Coherent的產能問題。襯底領域,AXT、Sumitomo、IQE等等,這些才是瓶頸。
Chris:IQE是什么?
@bubbleboi:有家英國公司,我認為他們做外延。在這個磷化銦制造鏈中有很多名字。目前基本上都是一場災難。
Chris:基本上就是沒有足夠的磷化銦供應全球?
@bubbleboi:是的,嗯,磷化銦礦目前我認為還好。但是將磷化銦加工成晶體,然后制成晶圓,然后在晶圓上做外延,再把激光器印制到晶圓上,所有這些,完全是一場災難。因為CPO激光器的工作方式需要更高的功率,這意味著你的芯片尺寸必須顯著增大,并且它們需要更窄的線寬和更好的噪聲性能,這通常意味著你必須增大芯片尺寸。
這也是為什么SiPho和Tower Semi漲上天的部分原因。傳統上,收發器世界的工作方式是,從EML開始,它基本上就是一個單一的 monolithic 磷化銦芯片,包含調制器(用于上下擺動光)和連續波激光器,都在同一個磷化銦芯片上。由于物理原因,EML的性能總是優于硅光。通常,在每一代收發器(如400G或800G)推出的一兩年后,人們開始轉向SiPho以節省成本。你設法讓SiPho的性能足夠好,然后省錢,因為現在你不再購買大的EML,而是購買一個更小的連續波激光器,然后把它放進SiPho模塊里進行調制。
但無論如何,這次SiPho漲上天了,因為每個人都想,等等,EML短缺了,然后那些生產EML的公司也生產CW激光器,他們正將產能重新分配給CW,因為它的利潤率更高,需求也更大。所以現在CPO的需求正在扼殺已經嚴重供應不足的EML供應。現在,1.6T收發器是第一代SiPho幾乎從一開始就占據主導地位的產品。我認為在六個月內它就占據了多數份額。我不知道完整的數據,但這完全不同。如果你看看每一代收發器以及SiPho與EML的市場份額對比,這次完全不同。這是因為磷化銦嚴重短缺。
接下來,我認為是內存,因為沒有潔凈室產能。有人問我這個問題,也不是完全愚蠢的問題:哦,三星,他們有邏輯晶圓廠和內存晶圓廠,為什么不直接把邏輯生產線重新分配給內存?因為內存晶圓廠在使用的設備、工藝和 所有 上都完全不同。所以只有三家公司能生產DRAM。它們全部被訂滿了。短期內不會有新產能上線。
Chris:也就是Hynix、Micron和Samsung?
@bubbleboi:是的,這三家。所以這是第二嚴重的瓶頸。但人們對此非常清楚。
Chris:這三家內存制造商之間差距大嗎?
@bubbleboi:我個人認為這不重要。有很多戲劇性和噪音。供應如此短缺。任何東西都能以80%的毛利率賣光。誰在乎?歷史上SK Hynix明顯領先,三星則有點自焚。情況非常糟糕。美光大概是第二。現在關于HBM4的 die 速度有很多內幕消息,來自供應鏈爆料人的各種噪音。基本上對于HBM,在HBM4、3E、3之前的所有HBM,其基礎 die(包含許多接口邏輯電路)都是在內部DRAM工藝節點上制造的。這之所以重要,是因為它更便宜,因為DRAM廠商用自己的晶圓廠來制造。但晶體管質量差得多。DRAM是為慢速、微小的晶體管和巨大的電容設計的,而不是為邏輯設計,所以速度受限。
所以到了HBM4, 所有人 某種程度上被迫放棄了這個策略。嗯,他們本應放棄這個策略。實際情況是SK Hynix去找了臺積電,開始使用12納米級別的工藝。這比他們用內部DRAM工藝拼湊出來的垃圾要好得多。但仍然是12納米,不是很好。三星有自己的內部SF4X邏輯節點,不是4納米,我最多說它能跟臺積電N6打平,或者在臺積電N6和N7之間。對于它需要做的事情來說相當不錯。美光很蠢。他們說,不,我們要用我們自己的內部DRAM工藝。他們有點搬起石頭砸自己的腳,耽誤了自己。然后有很多 drama,哦不,美光進不了Nvidia Rubin。沒人在乎。他們只會以天價賣出更多的普通DRAM或HBM3E。這些都不重要。這三家公司都將以相當高的價格賣光他們擁有的所有產品。質量差距現在相當接近了。以前三星的HBM3非常差,沒人能用。某些人無論什么價格都不會用三星的HBM3,因為有很多功耗問題。它太耗電了。但現在它們都足夠接近了,好吧,假設英偉達標準更高,拒絕了美光的HBM4,他們會把HBM4賣給其他人,或者干脆以驚人的毛利率出售普通DRAM。這不會在財務上影響美光。所以這方面幕后有很多 drama,我認為坦率地說很愚蠢。
Chris:當你說內存時,你特指DRAM還是HBM和DRAM?
@bubbleboi:是的,我說DRAM時就把HBM包含在里面了。都是同類的。我把內存分為DRAM和NAND閃存。就這兩類。DRAM就是所有不是NAND閃存的內存。
Chris:你說的第三大瓶頸是邏輯晶圓廠?
@bubbleboi:你可以看到英特爾漲上天了,問題正在解決。問題是臺積電就是沒有足夠的產能。他們太保守了。六個月前,三星在先進邏輯上基本上沒有利用率,幾乎為零。而英特爾只供內部用。現在有外部公司涌入,三星的利用率也變得相當高了。所以有一些彈性空間,邏輯情況在二月份看起來非常糟糕。現在好多了。雖然仍然相當糟糕,但沒有惡化。內存和磷化銦在過去六個月惡化了。邏輯有所改善,但仍然相當糟糕,因為建設這些生產線需要很長時間,而且再次強調,只有三個玩家:三星、英特爾、臺積電。
Chris:過去六個月還有哪些瓶頸惡化了?
@bubbleboi:不,主要是那兩個類別。我不認為功率半導體情況會變糟,但我認為它們是最有趣的類別,因為電動汽車情況不佳,所以有很多閑置產能。
Chris:你能解釋一下功率半導體嗎?
@bubbleboi:功率半導體將電力從一種電壓轉換為另一種電壓。你可以這樣想。你有一個幾千伏交流電的電網。你需要將其轉換為較低的交流電,然后最終需要將其轉換為直流電壓。800伏直流,400伏直流,240伏交流。最終經過幾個步驟后,你的高端邏輯芯片消耗大約1.2伏左右。更準確地說,每個高端邏輯芯片,那些3納米的芯片,標準電壓大約是0.75伏。還有一些高壓側電壓,比如1.1伏或1.5伏。所以你必須從非常高的電壓降到芯片所需的低得多的電壓。因此需要多個轉換階段。有些材料叫寬帶隙材料,碳化硅和氮化鎵,由于物理原因,它們比硅好得多。
Chris:效率更高,所以節省能源成本,并且需要更少的冷卻?
@bubbleboi:是的,沒錯。效率更高。而且能承受更高的電壓。你試著把硅芯片放在同樣的位置,它會燒掉,會自毀。
Chris:在你提到的公司中,TI、Navitas、onsemi、Infineon,你最喜歡哪個?
@bubbleboi:嗯,這周末我會發帖。快寫完了。目前在氮化鎵領域,TI和Navitas并列第一,Infineon遠遠落后第二。onsemi聲稱他們有很厲害的東西叫垂直氮化鎵。但只是幻燈片。沒有數據表,沒有實際規格。只是說,我們做了個東西,它會有這些驚人的數字。好吧,當然。所以onsemi,也許他們有東西,也許沒有。在碳化硅方面我還沒搞清楚,還需要幾天。但碳化硅方面一個有趣的玩家是,它是一個 meme 股票,但也不是 meme 股票。那就是Wolfspeed。
Chris:給我講講Wolfspeed。
@bubbleboi:他們 massively 過度建設了產能。他們是純碳化硅公司,并且垂直整合。他們制造晶圓、襯底,他們制造器件, 所有 都在內部完成。
Chris:順便問一下:對沖基金找你,只想聽聽你對某些事情的看法,你這樣做是因為好玩,這樣你也能了解他們問什么問題?
@bubbleboi:我也在學習。我了解到這些人的思維方式。因為我只是個小人物。我不影響市場。這些人才影響市場。他們也分享想法。特別是Wolfspeed,就是從一次對沖基金談話中得知的。
Chris:Wolfspeed是從對沖基金談話中得知的?
@bubbleboi:那是從五個來源來的。這是一只非常有趣的股票。他們是垂直整合的,100%美國本土。他們過度建設了碳化硅產能,然后被中國競爭和電動汽車 downturn 打擊了。他們真的破產了,第11章破產。他們不久前才從第11章破產中走出來,我想大概是四個月前。我得查一下。但確實是很近期的事。因為你的供應商破產了, 所有人 停止從他們那里購買。所以他們的工廠利用率據稱只有30%左右。非常非常低。現在他們回來了。問題是,如果市場有所好轉,這只股票能漲5倍。杠桿率太高,太瘋狂了。但它剛剛破產。而且它的毛利率是負的。你可以看他們最新的財報。他們的毛利率是負20%。他們的指引是,我們預計毛利率將繼續為負。他們 literally 每生產一顆芯片就虧錢,因為產能利用率太低了。
現在有趣的是,也是人們一直找我的原因,是Wolfspeed推出了這個10千伏的碳化硅芯片。這些芯片 literally 就是一個晶體管,一個必須承受 insane 電壓和電流水平的超級、超級強壯的晶體管。目前市場上額定電壓最高的碳化硅晶體管在1700到2000伏范圍內。Infineon有一個3.3千伏的器件。除了Wolfspeed,沒有人有高于這個的。Wolfspeed說,哦,我們可以做一個10千伏的器件。我看著這個數據表,這東西簡直是 insane。我不知道他們到底是怎么做到的。而且不是一眼就能看出,它到底是更好還是更差?因為晶體管只是開關,理想情況下,當你打開晶體管時,你希望它是一個完美的開關,沒有電阻。但這從來都不是真的。總會有一些寄生電阻。所以當晶體管導通時,它就像一個微小的電阻(這是過度簡化了)。我看著這個Wolfspeed器件的寄生電阻,以及損害開關速度的寄生柵極電容,并將其與競爭對手完全不同的器件,比如2000伏和3000伏的器件進行比較。寄生參數更差,但你只需要一個這樣的器件,而不是三個。我不得不查看一些電路仿真來弄清楚。我認為這個10千伏的器件實際上相當不錯。它將用于基礎設施。在數據中心里完全沒用。當我告訴這些基金的人時,他們說,哦不,它在數據中心沒用。我說,兄弟,你錯過了大局。固態變壓器。你需要為高壓交流電和數據中心之間的電網提供負載調節。
所以我更看好位于數據中心外部的電力輸送,而不是數據中心內部的。我覺得每個人都在關注誰會在英偉達設計和OCP設計的電源架中勝出,物理上位于數據中心內部。這是個有吸引力的機會。但位于數據中心外部、介于數據中心和電網之間的東西,也非常有趣。事實上,可以說更有趣。所以是的,我喜歡功率半導體。我認為這將是下一個爆發并成為瓶頸的東西。它不會成為主要瓶頸,因為電動汽車基本上不行了,所以有很多閑置產能。但它是最令人興奮的,因為情況將會發生變化。
Chris:你更看好數據中心外部的電力輸送,而不是內部的?
@bubbleboi:你有沒有開車經過看到變電站附近那些圓形的東西,還有那些大箱子?那些是傳統的變壓器。它們的工作原理是,你有一個巨大的鐵芯,然后一側繞著一堆銅線圈,另一側也繞著一堆銅線圈。這些基本上是無源器件,你可以將比如100千伏的交流電轉換為35千伏的交流電,然后將35千伏的交流電轉換為7千伏的交流電,然后再將其轉換為240伏、120伏的交流電進入你家。或者轉換為2000千伏的交流電供給工業用戶,用于長距離輸電。你想要極高的電壓以減少電力損耗。但要實際使用它,你必須用變壓器降壓。這些變壓器通常是被動的、笨重的東西,它們很糟糕,因為購買它們需要很長時間。你現在下一個訂單(這還是在AI熱潮之前),然后12到18個月后他們才會給你,因為它就是一大塊金屬。制造它需要很長時間。
我認為人們不理解的是,他們在AI數據中心方面遇到了一個大問題。想想看,假設你在電力公司工作,比如PG&E。你有新客戶接入你的電網,你必須管理他們,他們的負載在劇烈地上下波動。這些客戶會說,哦,我們現在需要一千兆瓦。然后五分鐘之后,不,實際上我們只需要八百兆瓦。這對電網運營商來說簡直是惡魔般的噩夢。我不知道你有沒有看到,去年推特上流傳,PyTorch團隊添加了一個特殊的標志,叫做"電廠別爆炸"。這是個有趣的事情。那么這個標志是做什么的?當時發生的問題是,你有很多GPU,1萬個,10萬個。它們在為訓練做大量計算,然后其中一些要么停止計算,要么以低得多的速率計算,因為它們在進行互聯、互相通信、全歸約等等。這導致了電網的不穩定。電網運營商說,無論你在做什么,停下來,否則我們就要切斷你的連接。這很危險。你們在 破壞 電網。所以PyTorch中這個標志的作用是,如果GPU不需要做計算,也強制它以最大速度進行計算。就讓它做垃圾計算,然后把垃圾結果發到 nowhere。假設你的芯片運行在500瓦。正常情況下,如果不工作,你會希望它降到200瓦。但在這里,不,我們不希望它降到200瓦。讓它一直保持在500瓦,因為我們不希望電網運營商對我們發火。電網運營商生氣的原因是,如果你考慮一個電力系統,當你有這些無源組件,這些無源變壓器時,任何對負載的推拉都會反向傳播到電網,使其不穩定。這在過去還好,因為電網人員會管理這些事情,并且有一些穩定電網的變通方法。但現在情況不再是這樣了。
我們剛談到了普通變壓器。現在有固態變壓器。我不知道為什么叫固態變壓器,因為以前的變壓器也是固態的,它們是無源的。與其用一大塊鐵和一堆銅線圈,不如用碳化硅芯片構建一些電路,你可以做同樣的事情,將高壓交流電轉換為低壓交流電,甚至直接將高壓交流電轉換為直流電。為什么人們以前不這樣做?這東西從2020年就有了。它更貴。你可以盡情抱怨傳統變壓器,但它們便宜,你等上12個月就能拿到貨。固態變壓器貴得多,但它們有一個巨大的好處。那就是你可以進行負載調節。你可以動態地編程固態變壓器,以確保兩側的電流和電壓大致相同。你可以改變開關頻率。所以如果負載增加,你可以以更高的頻率開關,或者如果負載減少,你就以更低的頻率開關。
Chris:他們在固態變壓器中使用功率半導體。
@bubbleboi:是的,所以這些是有源器件。它基本上就是一堆晶體管。不再是無源器件,一堆電感、銅線圈和一些二極管,而是晶體管。你通過打開和關閉晶體管來管理電力,不僅僅是轉換電力,還要管理它,以便你得到一個干凈的800伏,而不是800伏正負20伏之類的。或者輸送1000安培,而不是1000安培正負10%。你可以調節它。這非常重要,因為這樣你就不用在PyTorch中使用"電廠別爆炸"標志浪費電了,你可以降低GPU功率,你就能獲得巨大的效率提升。電網運營商也會對你更滿意。很多時候,許可問題,比如你試圖建一個數據中心,但許可沒批下來,你會想,為什么會這樣?這是因為電力公司會說,你會破壞電網穩定。我們不能這樣做。然后現在你可以說,好吧,我會安裝一些固態變壓器,這是我將如何不 破壞 你的電網的方案。然后電力公司會說,好吧,我把電賣給你,你自己接進去。所以人們通過各種創造性的方式繞過這個瓶頸。但我認為現在是時候做固態變壓器并承擔成本了,因為價值就在那里。是的,你為轉換電力的那個箱子付了更多錢。但你獲得了所有這些好處。我認為這將在明年開始加速。這更像是2027年下半年的故事。但股票的運作方式是,人們會搞明白然后提前買入。股票是 forward looking 的。所以這現在已經開始發生了,我認為在接下來的36個月里它會更加蓬勃發展。
Chris:相比于銷售固態變壓器的公司,你對功率半導體公司會更興奮嗎?
@bubbleboi:一般來說是的,因為至少我個人投資風格是理解工程,或者至少嘗試理解,并且我能找出差異點。我在比較,我能看出誰的芯片比誰的好,誰能收取溢價。那些購買這些芯片并組裝成箱子的公司,那里也確實有價值,因為涉及到控制方面。假設這個箱子有一千個非常強大的晶體管。如果沒有保護電路和控制,那是極其危險的。你可能會燒毀連接到它的所有東西,產生電壓尖峰。所以如何將這些功率半導體組合在一起有 careful 的設計考量。這里有兩家公司。很多人一直在向我推薦這個,我之前沒當回事。然后當第15個人發給我時,我說,好吧,我會讀一讀的。這兩家公司叫SolarEdge和Enphase Energy。它們的歷史是為太陽能電池板制造微型逆變器。太陽能電池板部署的問題是,太陽能電池板是直流的,但顯然你家是用交流電的,所以你需要將每個太陽能電池板從直流轉換為正確的交流電。然后還有很多安全方面的事情,你必須控制它,等等。所以這些公司為家庭太陽能部署做這些微型逆變器。自從家庭太陽能的稅收優惠政策變差以來,這些公司徹底完蛋了。你可以看看它們的股價。2021年左右有個泡沫,然后它們跌了90%。它們現在就是墊底的股票。這些公司正在轉向固態變壓器。他們看到了機會。我還沒時間深入研究,但我實際上認為這是靠譜的。這是一個超級愚蠢的想法。但我認為作為股票它實際上會漲。因為他們在這類器件的組裝和保護電路方面非常有經驗。而且這可以說比他們在太陽能領域做的更容易,因為你不是把它分布在整個屋頂上,你只是把所有東西放在一個盒子里,你可以更容易地進行過流保護。他們甚至有一些差異化的技術。Enphase有一個22納米的控制ASIC。他們自己設計了22納米芯片來控制所有這些微型逆變器,因為你需要進行一定程度的計算,并向所有這些模擬部件發送一系列不同的信號。這是一個分布式系統問題。基本上,你必須告訴一萬個晶體管它們需要以什么速度開關,然后還要檢測故障等等。所以他們有一個控制ASIC,這簡化了他們的工作。這是一個真正的競爭優勢。
Chris:Delta Electronics怎么樣?
@bubbleboi:是的,Delta是大玩家。所以有Delta、Vertiv、Eaton等等所有這些大公司。這是他們的核心業務。這是他們已經做的事。這些股票已經漲了不少。SolarEdge和Enphase有吸引力的地方在于它們已經被遺棄了,沒人關注。這些股票,如果成功,能漲5倍。你是想追逐像Vertiv那樣已經漲了很多的,還是想追逐這種有點 degenerate 的?所以這很有趣。這不是個壞主意。它可能成功。你想賭一把,就把投資組合的0.5%放進去。當然,為什么不呢。
Chris:對沖基金一般都問你什么?
@bubbleboi:他們通常想聽聽我對某些事情的看法,因為我的投資記錄是公開的,而且我的表現超過了他們所有人,不過請注意,我承擔了 insane 級別的風險。這些家伙很多是市場中性的,所以我的表現跟他們比并不公平。但我確實做得相當不錯。他們會問我意見之類的事情,很多時候都是技術性問題,因為我對估值一無所知。有時候有新基金問我,哦,你對估值怎么看?難道你不讀我寫的東西嗎?但,是的,工程類問題。例如,Wolfspeed那個事。他們沒人知道這個10千伏的碳化硅芯片到底好不好,以及會用在什么地方。我甚至覺得Wolfspeed自己也不知道它會怎么用,因為他們把核聚變反應堆電力輸送寫在了數據表和新聞稿里。我就想,你們這真是扯得太遠了。很多時候,公司管理層會告訴這些金融人士一些事情,他們會問,他們說的是真話嗎?我會回答是或否,或者情況復雜,你應該追問這些問題。所以主要是技術性的,但不完全是。
Chris:Cerebras,你現在怎么看?
@bubbleboi:我喜歡它。我也有一些 harsh 的批評。Andrew Feldman 顯然對此非常清楚。他們用的是FP16,這是個愚蠢的錯誤。如果他們實現FP4,僅此一項就能獲得3到4倍的容量。這是個容易實現的目標。這只是數字邏輯。他們還需要修復IO以卸載KV緩存。我不接受那種"哦,已經夠好了"的論點。這是個糟糕的借口。如果你有機會把你的產品提升10倍,你就應該把它提升10倍。不要滿足于平庸。最后,他們的毛利率表明他們的良率非常差。他們公開聲稱他們在晶圓級別的良率是100%,我相信他們,這意味著他們封裝晶圓的良率是糟糕透頂的。大概在20%到40%之間。我不知道為什么這么差,但他們需要解決這個問題。我仍然對他們有批評,更像是我想成為一個積極的投資者。我正在買入他們的一些股票。我不會離開。我持看漲態度,但也很苛刻,因為它本可以好得多。Andrew Feldman 對IO問題持否認態度。我說,不,伙計,別再否認了,快修好它。你可以做得更好。就把產品做得更好。
Chris:你仍然看空 neo clouds 嗎?
@bubbleboi:是的,有點。看看CoreWeave上個季度的情況。我認為基本上他們因為所有短缺(光學器件和內存)而面臨更高的成本。所有的金融人士都問,你們通過合同把成本轉嫁給客戶了嗎?CoreWeave的CEO試圖回答這個問題兩次,我完全不知道答案是什么。因為股價下跌了,我猜金融人士解讀為,不,他們被坑了。他們簽了長期合同,無法轉嫁成本。
Chris:對最可能倒閉的 neo clouds 有什么看法?
@bubbleboi:那些小公司。CoreWeave足夠大。Oracle足夠大。Nebius可能也足夠大。我不確定會不會倒閉,但最終會有問題。這里的債務水平。一旦出現 downturn,或者甚至如果加息,今年下半年可能會加息,那將對他們造成嚴重打擊。這只是一個糟糕的生意。還有很多其他很棒的東西可以投資。就去投那些吧。我不明白為什么人們想擁有這些垃圾。
Chris:Terafab?
@bubbleboi:沒有足夠的信息,除了看起來他們可能在授權Intel 14A工藝。這是我對情況的猜測解讀。沒有信息。
Chris:CPO的推廣會遇到很多問題嗎?
@bubbleboi:我不認為會有問題。擔心可靠性的人完全錯了,并且不懂工程。問題將是磷化銦短缺,那非常非常嚴重。但部署方面,不,我不相信會有問題。如果你做得對,如果你做足了功課,就不會有問題。實際上它會比收發器更可靠。
Chris:對Amkor有什么看法?
@bubbleboi:沒有,我不太關注封裝領域的玩家。
Chris:那Ibiden或Unimicron呢?
@bubbleboi:沒有,我不知道。沒有看法。
Chris:Nokia還是Infinera?
@bubbleboi:哦,是的。它有潛力成為便宜得多的Ciena版本。所以如果你覺得,哇,Ciena漲了很多,估值很高,那么你可以買Nokia,他們也在嘗試做同樣的事情。所以我認為這是一個真正的價值投資。它是少數幾個估值合理的東西之一。我目前沒有持有,但我進進出出過,我需要更多時間來考慮。但,是的,我喜歡它。
Chris:你偏好的參與磷化銦的方式是什么?
@bubbleboi:主要是Lumentum。更冒險的做法是AXT,然后半導體設備方面是德國公司AIXTRON。就這三家。
Chris:你認為目前什么被炒作得最厲害?
@bubbleboi:我會說是microLED,因為我認為這是一個騙局。有大約七種microLED的替代方案,而且它們在客觀上全都更好。所以,是的,我就是討厭microLED。
Chris:GE Vernova。
@bubbleboi:我持有不少。我在一個只做多的賬戶里,大概在170的價位買了很多股。我的平均成本價大概在170到250之間。它已經漲上天了,嗯,我想我永遠不會賣這個了。所以,是的,很棒。燃氣輪機。我運氣好,有人很早就給我透露了消息。他們的護城河質量很高。他們是少數能制造這個的公司之一。但到了這個地步,他們已經完全被訂滿了,股價也漲了這么多,我不確定股價還能怎么更高。產能從哪里來,或者漲價從哪里來?我不知道。
Chris:從你的只做多投資組合中選幾個:Besi、Rigaku、臺積電或Fujikura,哪個最令人興奮?
@bubbleboi:Rigaku。
Chris:那是用于先進封裝的X射線?
@bubbleboi:Besi已經漲了很多,所以在現在的價位買入,我不知道。但Rigaku,傳統玩家是Camtek和Onto,他們做基于光學的先進封裝檢測。這些X射線機器傳統上用于研發目的。假設你是臺積電,你正試圖開發你的2納米節點,在研發部分,你需要真正深入地觀察并弄清楚發生了什么,你會買幾臺這種Rigaku機器,把它們用于研發,然后再也不用了。現在情況已經發展到,由于全環繞柵極晶體管、背面供電以及下一代先進封裝更嚴格的公差,你必須使用這些X射線機器。你用光學就完蛋了。所以Rigaku正從 niche 研發轉向生產。Onto知道他們完蛋了,因為他們作為戰略合作伙伴收購了Rigaku 27%的股份。基本上,在Rigaku機器上運行的軟件就是Onto的軟件。所以很多人說,哦,這對Onto是利好。不,不是的。他們知道自己造不出機器,所以就去買了能造機器的公司四分之一的市值,然后順便賣點軟件。所以,就買Rigaku。所以,是的,那是我最喜歡的專業 niche 半導體設備。我喜歡它。
Chris:從你的交易賬戶中:Tower Semi、Lumentum、Intel、Bloom、Semtech,哪個最令人興奮?
@bubbleboi:Semtech。絕對是Semtech。其他的已經漲了很多。Semtech,我仍然認為人們沒有完全理解他們做什么。
Chris:我非常天真的理解是它讓銅線工作得更好?
@bubbleboi:那是真的,但那只是故事的一小部分。他們制造模擬放大器和模擬均衡器。美妙之處在于,這可以用于有源銅纜,可以用于PCB,可以用于線性可插拔光學器件,可以用于傳統收發器,可以用于Arista XPO的東西,可以用于近封裝光學器件。這他媽的是 所有。不僅僅是銅,是 所有。太棒了。而且他們擁有最高質量的部件。基本上是他們和MACOM之間的雙頭壟斷。Semtech的部件就是更好。我看過數據表。我用過這些東西。所以很多金融人士,他們和一些業務人員做專家電話會議,哦,是的,我們有兩個供應商,等等。我說,兄弟,比例是多少?大概是90% Semtech,因為Semtech的部件好得多。所以,是的,Semtech還有很大的上漲空間。這他媽太棒了。它無處不在。不僅僅是銅。
Chris:在不同的細分領域,低、中、高,你認為HBM緊俏程度如何?
@bubbleboi:是的,高。
Chris:硅光、光學器件、CPO。
@bubbleboi:也很高。考慮到Tower的情況。
Chris:Tower發生了什么?
@bubbleboi:人們提前為2027年、2028年的產能付錢給Tower。他們的股票漲了大概15%。那是幾十億美元的市值增長。他們被訂光了。
Chris:你認為光學器件中哪個子集最重要?
@bubbleboi:磷化銦部分,激光器。
Chris:先進封裝。
@bubbleboi:我不認為那會成為太大的問題,因為英特爾正在大量增加產能。我想英特爾在馬來西亞有很多產能。
Chris:對EMIB的看法?
@bubbleboi:是的,EMIB很好。直觀上你可以認為EMIB基本上和CoWoS-L是一樣的。有一些技術細節,但從設計者的角度來看是一樣的。18個月前EMIB的問題是英特爾在設計規則和客戶服務方面有點愚蠢,非常糟糕。然后Lip-Bu Tan來了,解雇了一堆人,現在好了。現在人們正在把東西轉移到EMIB,因為,第一,臺積電沒有足夠的CoWoS產能,第二,臺積電更愿意用他們的潔凈室空間來生產60-70%毛利率的N3,而不是用來做CoWoS。所以我認為先進封裝的情況,至少相對于其他東西,不會像人們想的那么糟。其他東西會更糟。
Chris:ABF基板。
@bubbleboi:我知道的不夠多。
Chris:HBF。
@bubbleboi:我完全不喜歡高帶寬閃存。我不認為這是一個好的解決方案,因為它會有耐久性問題。所以我就是不喜歡它。我甚至不想把它看作一個瓶頸。我只是覺得這是個壞主意。如果你要為此類應用使用閃存,那么你需要讓它可插拔。如果它是可插拔的,你就不需要堆疊它。你可以把它放在CXL控制器周圍,然后放在服務器的某個地方。
Chris:晶圓。
@bubbleboi:磷化銦晶圓,相當糟糕。碳化硅晶圓,不。普通晶圓也不,可能還好。
Chris:PCB。
@bubbleboi:很糟糕。支持200G SerDes的高速、最高質量的材料,是的,非常糟糕。 所有人 基本上都被訂光了。
Chris:那里有偏好的投資標的嗎?
@bubbleboi:我交易過TTMI,進進出出,但現在它漲太多了,我不想再碰了。所以,是的,我不知道該投資哪個。還有好多臺灣的玩家我不關注。這是我不碰的領域之一。
Chris:電力和變壓器。
@bubbleboi:感到興奮,是的。瓶頸,不是。有很多閑置的晶圓廠產能。但是最興奮,是的。
Chris:興奮是因為它在技術上對你來說很有趣?
@bubbleboi:技術上很有趣,而且是下一個會爆發的東西。Lumentum的股票在財報后沒漲的一個很大原因,它跌了然后又漲了,是因為Hurlston告訴 所有人,好吧,我們未來兩年的東西都賣光了,這告訴金融人士,好吧,就 upside 而言不會變得更好了。Wolfspeed有潛力漲5倍。它可能會真的瘋狂。然后所有常規的功率半導體公司,Infineon、TI、onsemi、STM,它們都能翻倍。它們能翻倍。這還沒有被定價進去。其他的已經被定價了。這個還沒有。
Chris:網絡交換機。
@bubbleboi:還好。它只是與邏輯晶圓競爭,并且需要一些CoWoS,但不多。還好。
Chris:光纖。
@bubbleboi:目前不太好。有一些問題。我不認為它像其他東西那么糟,所以姑且說是中等吧。特別是保偏光纖。在某些情況下需要的一種更昂貴的類型。
Chris:液冷。
@bubbleboi:還好。我沒聽說有什么問題。
Chris:組裝和測試相關的東西。
@bubbleboi:那可以增加產能。正在增加產能。增加產能不具挑戰性。
Chris:CPU。
@bubbleboi:大問題。是的,大問題。英特爾可以在一定程度上增加產能。這就是為什么它的股價漲了這么多。AMD,他們在一定程度上增加了產能,因為他們正在使用他們舊的基于N5的CPU設計,并重新增加那個的產能。但現在他們這樣做了,如果CPU情況惡化,他們該怎么辦?
如果我是AMD,我想利用我的臺積電分配,賣GPU還是CPU?你必須選擇。ARM沒有晶圓。高通。盡管我討厭承認,唯一能幫助解決CPU困境的是高通,因為他們在臺積電有很多晶圓。
但問題是,高通是唯一有晶圓產能并且可以將其轉向CPU的大玩家,因為如果Android繼續斷崖式下跌,他們仍然在臺積電有那些晶圓的訂單。他們可以告訴臺積電去印制CPU設計來代替。這就是為什么高通漲了這么多,因為人們抱有希望。高通在數據中心CPU上已經失敗了三次。這是他們的第三次或第四次嘗試。如果他們這次還搞不定,那真的就沒希望了。它只需要能用。如果能用,人們會買它,他們會從中賺很多錢,這將拯救公司于Android崩潰和蘋果即將到來的訴訟。
Chris:CPU你更看好誰?
@bubbleboi:我更喜歡英特爾做CPU,因為沒有什么能讓我買高通。但是基金的人問過我,哦,我應該買高通做CPU嗎?好吧,如果你想相信這些笨蛋,你可以買。但我不會。但是當然,如果你想投,那就投吧。我承認他們有很多產能,我承認他們有很多產能,而且他們有可能做成。
Chris:DRAM也是高瓶頸?
@bubbleboi:是的,我基本上把DRAM和HBM視為等同。
Chris:硬盤?
@bubbleboi:沒有看法。我猜既然NAND短缺,硬盤可能也變得更緊張了。我對此了解不夠。
Chris:數據中心廠房?
@bubbleboi:我不跟蹤那些東西。沒有看法。
Chris:功率半導體對你來說會是高瓶頸嗎?
@bubbleboi:不,現在是低。目前還不是瓶頸,但一年后會成為瓶頸。所以這就是它最有趣的地方,因為它有上漲空間。
Chris:NAND。
@bubbleboi:我認為DRAM享有溢價。NAND也和DRAM一樣短缺,但我認為NAND更危險,因為它比DRAM更容易出現供應過剩。但,是的,高瓶頸,不過我要說我更偏好DRAM而不是NAND。
Chris:是否有任何模型變化,比如長上下文、更多強化學習、世界模型,你預計會極大地改變硬件需求?
@bubbleboi:我真誠地認為所有人都在朝著更長的上下文長度發展。這其中有經濟價值。人們愿意為更長的上下文長度付費。所以這會傷害所有內存,所有。這只是大概的高層次觀點。我不太關注模型架構。但從經濟方面看,是的,人們想要超長的上下文長度或長序列的token。
Chris:如果你是老黃,你下一步會鎖定什么供應?
@bubbleboi:他已經鎖定了所有東西的供應。我正想說光纖,然后他就去搞定了Corning的交易。我認為此人如神,他已經鎖定了所有。我想他確實做到了。
Chris:哪一家公司你會推薦給你的父母,作為持有10年的投資?
@bubbleboi:英特爾,因為英特爾是一個瘋狂的長期持有標的。還有博通、是德科技。SiTime,但也許不是在這個價位。英偉達,顯然。臺積電。這些都是長期的,可以閉眼買。
Chris:博通,我猜想他們所有的客戶都積極希望擺脫對他們的依賴,還是這不是問題?
@bubbleboi:谷歌正在嘗試。我告訴你,進展并不順利。除了Lumentum,另一個磷化銦的大玩家實際上是博通。沒多少人知道這個。博通有一個巨大的激光器部門。非常多元化的公司。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.