![]()
隨著封裝越來越復雜,實驗室性能與工廠實際生產之間的差距越來越大。
人們普遍認為先進材料在實驗室中的表現與在生產中的表現相同,但這種假設現在正面臨嚴峻挑戰。
通常情況下,實驗室檢測結果會成為產品規格,進而成為鑒定基準。而鑒定基準又會成為評判現場性能的標準。在行業發展的大部分歷史時期,這套推論體系都相當有效。當時材料種類較少,疊層結構較為簡單,層間相互作用也足夠可預測,因此規格表中的數據能夠合理地反映實際生產情況。
但隨著異構集成從工程上的新奇想法發展成為高性能計算的主流架構,單個封裝中的材料數量急劇增加。它們之間的相互作用更加復雜,影響也更大,而且這些封裝的運行環境比當初設計用于驗證其性能的測試條件更為嚴苛。
“現在的情況和過去不一樣了,以前只要有了單個芯片,了解了它的工藝流程,就可以直接投入生產,” Amkor芯片和FCBGA集成副總裁Mike Kelly說道。“現在大多數封裝在機械結構上都相當復雜,電氣方面更是如此。要開發出一個完善可靠的解決方案,需要大量的現場測試和開發工作。這一點的重要性怎么強調都不為過。”
一種材料在孤立環境或受控實驗室條件下的表現,越來越難以準確預測其在與其他不同材料共存、經歷多階段熱歷史以及需要在數百萬小時運行中保持可靠性能時的性能。如今,先進人工智能硬件所需的封裝在機械和電氣方面都比前幾代產品更加復雜,曾經使設計決策變得簡單的生產經驗如今已不再適用。簡而言之,實驗室與工廠之間的差距并非新鮮事,但正在日益擴大。
復雜性問題
材料在生產過程中出現不良性能的最直接解釋,也是最令人難以接受的解釋。如今構建的系統過于復雜,任何人都無法事先進行全面建模,而導致問題的相互作用往往是任何一個學科都未曾想到要檢查的。
“當你把各種不同的材料、各種不同的硅片集成在一起時,所有這些都會帶來固有的變異性,”Critical Manufacturing 的項目經理 Tiago Tavares 說。“指望我們能在設計階段就預測并控制所有這些變異性是不現實的。你需要模擬幾十年才能涵蓋所有情況。這種方法已經行不通了。”
半導體制造一直以來都涉及對變異性的管理,但如今的變化在于,單個封裝內相互作用的因素數量激增,且這些相互作用的耦合程度也顯著提高。傳統的單芯片采用單一材料組合、單一工藝流程,以及一套經過數十年生產經驗積累而具有相當可預測性的相互作用。而現代多芯片封裝,例如堆疊式存儲器、異構芯片組和有機中介層,則隨著堆疊中每引入一種新材料,潛在的相互作用就會呈爆炸式增長。
“你們在夾層材料里越來越多地使用一些比較特殊的材料,”塔瓦雷斯說。“這就好比做三明治,你根本無法預知火腿和奶酪的成分會有什么變化。所以,流程執行和流程設計仍然至關重要,但它們已經遠遠不夠了。你們需要持續不斷地監控生產過程。”
由于封裝組裝方式的根本性結構轉變,監控難度進一步增加。在整體式工藝流程中,工藝工程師可以將每個步驟視為一個相對獨立的優化問題:調整蝕刻配方,測量結果,然后再次調整。由于一個步驟的改變對后續步驟的影響有限,因此自由度是可控的。但在異構封裝中,這種獨立性不復存在。每個工藝步驟都會繼承前一步驟的機械、熱學和化學歷史,每一次調整都會產生影響,而這些影響往往要到很久以后才能顯現。
塔瓦雷斯補充道:“你不能再像分析孤島一樣分析一個過程了。其中的相互作用越來越明顯,也越來越復雜。因此,你不能僅僅因為改變了A步驟就貿然做出改變,而不去考慮B、C、D步驟之后會發生什么。”
模擬的不足之處
如果復雜性問題僅僅是運行更全面的模擬,那么原則上是可以解決的,即使計算成本很高。模擬工具的構建基于對哪些效應被視為一級、二級或可忽略效應的明確選擇。在大多數情況下,這些選擇是合理的。但是,先進封裝中遇到的情況并非總是典型的,在簡單封裝中出現的二級效應,在更復雜的封裝中可能成為主要的失效機制。
Synopsys產品營銷總監Marc Swinnen表示:“機械應力不僅會影響可靠性,還會改變受力器件和導線的電氣參數。但機械應力和電氣應力很少被同時考慮。任何仿真器都基于對哪些效應需要納入考量的基本選擇。由此產生的問題是,在某些情況下,一個微小的影響實際上會被放大很多。”
因此,封裝器件可能通過了電氣和機械仿真,但在生產中仍然會失敗,因為這兩種效應之間的相互作用從未被建模。這是由于仿真工具的歷史發展方式造成的,這些工具由一些團隊開發,而這些團隊在相鄰領域的專業知識有限,因此只針對特定的物理領域進行優化。芯片設計師沒有接受過電磁仿真方面的培訓,封裝工程師也沒有接受過靜態時序分析方面的培訓。這些領域之間的界限,恰恰成了模型與現實最容易出現偏差的地方。
“芯片、封裝和電路板的設計通常是分開進行的,但它們之間卻有著密切的聯系,”斯溫寧說道。“這種聯系往往被大量的安全裕度所掩蓋,這些安全裕度是為了應對連接芯片、封裝和電路板可能帶來的未知影響。但安全裕度并非沒有代價。它們會降低性能并增加成本。”
即使物理模型設定正確,仿真也難以有效處理變異性問題。例如,在標稱溫度下性能符合規格的設計,在受到相鄰部件的熱梯度影響時,其性能可能會發生改變。此外,一種材料在制造裝配過程中可能承受遠超實際應用環境中的應力,即使其機械應力極限被設定為特定值。這些變量在生產過程中可能同時出現,即使使用先進的仿真工具,也很難對其進行全面驗證。
材料數據問題
仿真挑戰背后隱藏著一個更為根本的問題。用作仿真輸入的材料屬性值通常是錯誤的,或者至少是不完整的,而如果沒有制造商不愿分享的數據,這些問題很難得到糾正。
知識產權問題是彌合仿真與生產實際情況之間差距的核心障礙之一。仿真工具從數據庫中獲取材料屬性,這些數據庫匯總了已發表的測量數據、科學文獻或代工廠提供的規格說明。對于硅和銅等特性明確的材料,這些數據庫相當準確。但對于新型材料,例如新型玻璃成分、特種介電材料和專有聚合物粘合劑,數據庫條目稀少,有時甚至過時,偶爾還會出現錯誤。
Synopsys產品管理負責人郎林表示:“仿真工具會從互聯網或科學測量數據中獲取一些通用屬性,或者使用代工廠提供的數據。制造商必須向我們的仿真工具提供或披露其材料的特定屬性,這樣我們才能說仿真結果具有良好的相關性。否則,就不存在相關性。”
問題在于,最精確的材料屬性數據往往也是最具商業敏感性的。一家玻璃基板制造商花費數年時間研發出特定的材料成分和拋光工藝,卻沒有動力將該材料的精確機械和熱學性能數據分享給整個行業。這些數據所蘊含的競爭優勢正是其研發投入的根本所在。結果就是結構性錯配。最需要精確材料數據來構建可靠模擬的工程師們,卻只能使用精度最低的版本,而掌握精確數據的機構也有充分的理由不予公開。
對于處于包裝工藝前沿的新型材料而言,這個問題更為根本。對于成熟材料,其材料性能隨溫度變化的非線性行為已得到充分理解,但對于新型材料,這種行為往往難以捉摸。
林說:“你必須對材料的力學性能隨溫度變化的非線性行為進行建模。我們可能很了解純銅。但對于具有某種改性材料特性的玻璃來說,其溫度依賴性會是什么樣的呢?它可能以我們未知的方式呈現非線性特征。”
當現場發現實驗室遺漏的問題時,這些建模缺陷的后果就會在生產中顯現,有時甚至會進一步蔓延到下游,導致難以追溯根源的現場故障。故障到達現場的方式存在著一定的規律。主要原因很少是材料本身未能達到標稱規格,而是制造過程中引入的潛在缺陷,而這些缺陷并非認證流程所能檢測的。
“許多現場問題都源于制造過程中引入的潛在缺陷,”安靠公司負責引線鍵合和BGA產品的副總裁Prasad Dhond表示。“污染、工藝偏差和設備故障都是潛在缺陷的來源,這些缺陷在現場可能會加劇。除了產品認證之外,生產控制以及工廠和裝配線的運營方式也至關重要。”
難點在于,潛在缺陷并非總是一開始就以缺陷的形式顯現出來。最終會導致良率損失的信號可能在工藝流程早期以模糊不清的形式出現:例如輕微的顏色變化、光學異常,或者看起來更像是干擾而非失效機制的現象。早期可見的現象與后期會產生影響的因素之間的聯系,只有在積累了足夠的數據后才能明確。
這是復雜制造流程的一個結構性特征。缺陷顯現、可測量以及導致故障的時間點各不相同,通常相隔數周的處理時間和數十個中間步驟。鑒定測試位于該流程的末尾,僅詢問器件是否合格。它并不探究故障的根源,而這才是真正能夠彌合實驗室模型與工廠實際生產之間差距的關鍵所在。
“你會發現缺陷,有時很難發現,分析結果可能只顯示為變色。如果只是外觀上的瑕疵,其實沒什么大礙,” Microtronic的應用總監Errol Akomer說道。“但當這批產品進入檢測階段時,就檢測不合格了。這樣你才能知道哪些缺陷會造成損失,哪些不會,哪些可以忽略,哪些需要仔細檢查,因為確實存在問題。”
生產中故障分析的經濟性問題使這一挑戰更加嚴峻。當芯片在現場發生故障時,人們的第一反應往往是更換芯片并繼續生產,而不是將其回收進行分析。原本可以幫助工程師了解故障原因并構建更完善模型的數據,卻隨著故障部件一起被丟棄了。
Amkor公司的Kelly表示: “只有當有故障發生時,收集數據來確定故障原因才有意義。 故障越少,數據越少,模型就越不準確。這是一個悖論。在某個階段,你會停止建模,開始構建,然后在早期生產環境中不斷改進,最終達到你真正想要的目標。但仍然存在差距。”
案例研究揭示差距:在生產線中間金屬化過程中引入鉬來替代鎢,這說明了從實驗室到制造環節的差距,而這與封裝無關,卻與表征材料和集成材料之間的根本區別息息相關。
在邏輯、DRAM 和 NAND 等器件目前追求的小尺寸特征范圍內,鉬相比鎢具有顯著的電阻率優勢。更短的平均自由程意味著鉬能夠在更小的尺寸下充分發揮其導電優勢,而鎢則越來越難以做到這一點。此外,由于鉬直接粘附在氧化層上,不會滲透到介電層,因此無需單獨的阻擋層和襯墊層,從而使更多可用空間能夠填充功能金屬,而不是高電阻率的支撐材料。在實驗室中,根據單元工藝驗證的關鍵指標進行測試,鉬的性能表現良好。
但將新材料投入生產則是一個不同的問題。開發單元工藝——包括沉積工具、薄膜性能、均勻性和顆粒行為——需要材料工程師和工藝工程師的通力合作。單元工藝開發無法在獲得生產數據之前解決的是,新材料在特定客戶的工藝流程、周圍材料和集成方案中的具體表現。
“當我們進入測試階段,客戶開始嘗試采用這款薄膜時,真正的挑戰在于如何將薄膜集成到他們的工藝流程中,” Lam Research公司副總裁兼總經理 Kaihan Ashtiani 表示。“薄膜的各項要求,例如運行速度、觸點填充效果、電阻率是否符合規格、均勻性以及顆粒行為——這些都是我們在設備開發方面需要關注的。但如何將薄膜集成到客戶現有的工藝流程中,才是真正需要學習的地方。DRAM、NAND 和邏輯芯片的要求各不相同,這些都是我們在進入測試階段乃至最終量產階段時面臨的挑戰。”
關鍵不在于鉬本身存在任何根本性缺陷,而在于任何新材料在生產中的表現都取決于其與特定工藝環境的相互作用,而這種環境無法在材料表征的開發環境中完全復制。每個客戶的集成都有其自身的熱預算、相鄰材料和工藝順序限制。在單元工藝開發中看似微不足道的薄膜特性,一旦與下游特定的蝕刻化學反應發生相互作用,或者沉積在經過一系列實驗室從未模擬過的預處理步驟的表面上時表現出與預期不同的行為,就可能成為首要考慮因素。Lam公司多年來在鉬的單元工藝開發上投入巨資,最終獲得了特性明確的薄膜。但它無法獲得預先表征的集成方案,因為每個集成方案都因客戶和器件類型而異。實驗室結果與生產環境的最終交匯點,正是差距所在。
彌合差距
面對這些挑戰,業界并未袖手旁觀。目前,大量的工程研發工作正致力于通過機器學習來構建虛擬世界和物理世界之間更緊密的聯系,從而探索純粹基于物理建模無法觸及的設計空間,并將制造車間視為模型校準的持續源泉,而非下游終點。
然而,不受約束的機器學習應用于制造數據時,它本身并不了解它所處的物理空間,這意味著它可以在其訓練數據中進行激進的優化,但產生的結果卻會在生產中失敗,而失敗的原因正是該模型從未被訓練去考慮的。
“你可以用現有的數據集進行訓練,但機器學習實際上并不了解它所處的空間,也不知道如何在該空間內進行優化,”Lam Research旗下Semiverse Solutions的總經理Joseph Ervin說道。“使用虛擬硅可以為機器學習空間引入約束和物理規律,從而指導工藝步驟和參數在哪些方面能夠真正取得成果。”
該方法包括構建正在建造的設備的三維虛擬表示,將其與實際生產過程中的在線計量數據對齊,并使用對齊的虛擬模型來指導機器學習優化,同時針對多種良率失效模式進行優化。
數據問題依然難以解決。彌合實驗室與工廠生產之間差距所需的數據至少在理論上是存在的。真正的挑戰在于,收集、解讀這些數據并將其與正確的工程決策聯系起來,需要一定程度的機構知識和協作意愿,而這方面目前仍在發展之中。
“人們仍在了解各種影響和組合,”關鍵制造公司的塔瓦雷斯說。“這需要一段時間才能被人們接受。數據是存在的,但首先你需要知道自己在尋找什么。數據并不等同于信息。將數據轉化為信息的能力仍然是一個挑戰。”
用于彌合實驗室到工廠差距的工具正在不斷改進。我們擁有更完善的仿真框架、受物理約束的機器學習、更豐富的在線計量技術以及更先進的數字孿生模型。然而,這些新環境下需要發揮作用的材料確實是全新的,它們之間的相互作用也僅被部分理解,而用于可靠表征其在生產中性能的經驗基礎仍在積累之中。這種差距的存在是因為材料應用的速度超過了我們充分理解其后果的速度。
*聲明:本文系原作者創作。文章內容系其個人觀點,我方轉載僅為分享與討論,不代表我方贊成或認同,如有異議,請聯系后臺。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.