![]()
阿里云正通過一場體系架構的變革,刺破行業(yè)寧靜,重新定義下一代的云。
借此,它將不僅進一步奠定云計算、數字化技術底座基礎,還將有望重新激活核心板塊IaaS層、PaaS層的效能與高質量增長,大幅擴充技術增值,提升綜合毛利,最終帶動整個SaaS化生態(tài)的進程。
這一信號,集中閃爍在幾日前的阿里云2023財年首場峰會上。
按往年風格,阿里云智能總裁、達摩院院長張建鋒(花名:行癲)常會在首場峰會拋出影響全年或更長一段的整體戰(zhàn)略、升級動向,為全年定下基調。當然也會有核心技術與產品,但更為關鍵的進展,大都會在下半年云棲大會釋放。
這次味道有點不同。
“今年我們最重要的策略是B2B,就是Back to Basic,回到云計算本質。云計算的核心競爭力是技術,我們堅持在技術的長征路上,不斷取得新的突破。”當日,行癲演講中強調。
Back to Basic,回歸核心技術。倘無重磅技術創(chuàng)新,峰會可能空洞,很難形成年度戰(zhàn)略指引。
那么,上述所謂刺破云計算行業(yè)底層寧靜感的底層技術創(chuàng)新,是個 什么 呢?
那就是行癲拋出的一個面向下一代云計算服務的全新體系架構,也即“CIPU+飛天云操作系統(tǒng)”。
架構創(chuàng)新大都不輕松。既可能涉及微觀的設計創(chuàng)新,也可能涉及重大的體系架構。你知道,10多年前,阿里云就倡導“去IOE架構”。至今諸多關鍵垂直場景,仍在滲透與替換。
飛天云操作系統(tǒng)早有口碑。它是阿里云誕生后的重大創(chuàng)新。也是阿里云多年來軟件定義計算、存儲、網絡等服務的象征。放在云計算能力體系里,它更近阿里云PaaS層的核心支撐體系。
那么,CIPU誕生的邏輯如何?它與飛天云操作系統(tǒng)之間,又將如何定義全新的體系架構?
在行癲那里,這與云計算發(fā)展至今面臨的挑戰(zhàn)與困惑有關。
他認為,截至目前,云計算發(fā)展已經歷兩大階段:
一、分布式、虛擬化階段。
主要生成于互聯(lián)網企業(yè)高速成長進程。后者驅動了大規(guī)模、超大規(guī)模的數據中心誕生,由此亦催生出分布式和虛擬化代表的云計算技術。同時,在互聯(lián)網企業(yè)推動下,快速完成從傳統(tǒng)大機向分布式系統(tǒng)的遷移,并發(fā)展出許多新技術、新生態(tài), 尤其 開源生態(tài)。
二、資源池化階段。
在以CPU為中心的分布式架構下,云計算公司通過軟件定義,將計算、存儲資源池化,構建計算、存儲分離的架構,對資源統(tǒng)一的調度編排,提供給客戶,以云原生方式重新設計整個架構跟軟件。兩大階段的相通之處,即在于通過軟件定義計算、存儲、網絡。這也是過去多年來言必稱的風潮。至今仍在延續(xù)。
不過,在行癲看來,軟件定義固然靈活,但只靠它,已很難真正挖掘出硬件形態(tài)資源的效能。而它對以CPU為中心的傳統(tǒng)計算體系架構的優(yōu)化,已到瓶頸期。之前,與Facebook有關的一份報告顯示,高達30%以上的硬件性能浪費了。
一重 壓力來自需求面。云上客戶需求已發(fā)生重大變化,數據 高密 型計算越來越多,它們對云計算提出了更高的低時延、高帶寬需求,傳統(tǒng)基于CPU為中心計算體系架構的優(yōu)化,無法滿足。
另一重,則是現有云計算平臺技術、運營正面臨三大挑戰(zhàn)。即:
1、 計算 和網絡傳輸時延壓力大。多年來分布式風潮下,一個大型應用分散在多個子系統(tǒng)部署,它們之間需高速互聯(lián);
2、IDC內部交互流量擴大,亟待網絡升級;
3、系統(tǒng)規(guī)模日益龐大而復雜,亟需解決超大規(guī)模基礎設施的復雜管理與 云 內部超大應用管理問題。
這該怎么辦?
你應該看到,上述壓力既涉及硬件技術問題,也涉及軟件 層面 復雜管理、協(xié)同、調度問題。
說白了,就是云計算既要滿足超大規(guī)模的計算、性能要求,又要滿足軟件定義的靈活性。這在過去是一組矛盾。
要解決它,必須一硬一軟,兩者兼顧。
阿里云CIPU正是軟件定義與數據中心硬件資源的新一層。它超越了傳統(tǒng)CPU為核心的架構,一旦接入它,計算、存儲和網絡資源即可被加速、高效云化,最大限度地挖掘整體資源效能。
![]()
在此基礎上,CIPU硬件形態(tài)與飛天操作系統(tǒng)軟件定義優(yōu)勢結合,既可高速云化算力資源,又能通過飛天實現規(guī)模化、靈活高效的管理和調度。
你可能覺得CIPU似乎并不新。
外界早有類似的硬件 層 。比如亞馬遜2017年就開始定義Nitro,英偉達們定義了DPU,英特爾則崇尚IPU概念。至于各有對標的AMD、Marvell的同類產品不多說。各家方案雖有差異,但核心基本都是通過將將原基于CPU形成一些功能負載卸載到專用的加速器新硬件。
但這里面明顯有兩大派系。
一是硬件出身的英特爾們。
英特爾不晚。有過FPGA收購,也有SmartNIC實踐,后者旨在提高數據中心網絡吞吐量。后有別于DPU推出IPU。因進一步走出x86,一度被視為變革。人們注意到,最近幾年,它幾乎不談摩爾定律。
但這類,阿里云早有 成熟 脈絡與運用。2017年公布moc卡,2018年正式商用。作為神龍技術 架構 核心。在行癲那里,MOC卡是“一個全新里程碑”。后來,依托它,實現規(guī)模化RDMA,替代了專用網絡交換機和網卡設備,行業(yè)普惠效應遠大于硬件出身的英特爾們。后者其實很難徹底超越X86架構利益思考問題,革自己的命很難。另外,它們的商業(yè)化實踐,多通過傳統(tǒng)伙伴尤其惠普、戴爾等硬件企業(yè)落地。
看似相近的硬件層,實際軟件定義實踐上,無法與公有云能力深厚的阿里云們相比。缺乏云計算各種場景實踐與驗證,本就是硬件巨頭們的短板。
當然,我們不是否定硬件一端的創(chuàng)新。我們也并不認同那種“CIPU徹底替代CPU”的說法。
CIPU本就具有高度兼容性,連接各種異構計算。它有部分計算功能,但與飛天結合后的敏捷、靈活的管理、調度、普惠才更核心。未來,即便CIPU協(xié)同平頭哥其他資源如自研架構、倚天(ARM架構)、RISK-V等路徑替代部分基礎設施,它與飛天云操作系統(tǒng)結合的體系架構也不可能走向排他。當然,特定行業(yè)與場景是另一回事。
這其實是阿里云變革行業(yè)體系架構的精髓,也是新架構核心競爭力之一。CIPU更近面向所有硬件基礎設施高速云化的加速器與OneAPI,而飛天則實現靈活、敏捷、精益的管理,這種能力更近商業(yè)層面。
媒體關注CIPU更多。實際上,它與飛天是天然的高度耦合關系。脫離一方談體系架構變革都不成立。某種程度上,CIPU是飛天云操作系統(tǒng)能力的衍生與補充。這不是矮化硬件。而更多站在客戶角度說,它們并不清楚甚至不需要了解 背后 各種硬件邏輯。真正意義上的數字基礎設施,它的體感本來就更多體現為對技術的脫敏與無感。畢竟,做個飯,誰有空天天思考“水電煤”背后的形態(tài)。
脫離飛天云操作系統(tǒng)孤立談CIPU,于阿里云來說,沒多大意義。孤立的硬件形態(tài)CIPU,雖然有作用,但沒有飛天,根本不可能解決行業(yè)痛點。
另一派,則是亞馬遜們。
AWS富有口碑,2017年開始定義Nitro。要說CIPU沒一點對標它的用意,恐怕很難。
但兩者痛點更接近。而具體差異,我覺得阿里云虛擬化技術負責人蔣林泉(花名:雁楊)的表達比較生動。
他說,主要有兩點:
1、兩家區(qū)別更多在于身處不同市場,“看到的風景不一樣”。但阿里云指標,尤其性能、應用跑起來后,無論計算、存儲還是網絡技術上,“超越對手不是一點點”。因為,國內客戶對性能和性價比的要求非常 極致 ,背后也有阿里云垂直技術棧支撐。
2、國內云計算企業(yè)客戶和海外成熟度 差異 。主要是業(yè)務操作系統(tǒng)分布不均衡。中小客戶需要沒那么多能力做更多高可用,它們需要普惠服務。如此,阿里云相比美國同業(yè)面臨的挑戰(zhàn)與機遇就是,在高性能情況下,保證大規(guī)模、高可用的穩(wěn)定性。
關注最大多數客戶群體,從它們需求出發(fā),建構普惠的技術與商業(yè)體系,一直是阿里云乃至阿里集團誕生以來的邏輯,也是它們的核心競爭力。淘系如此,阿里云如此,“CIPU+飛天云操作系統(tǒng)”新體系架構也是如此。
這也是夸克長期以來更多從技術創(chuàng)新與商業(yè)化維度思考創(chuàng)新的基本邏輯。
文章開頭,我們強調了新架構的技術創(chuàng)新,但重心仍在商業(yè)化層面:“CIPU+飛天云操作系統(tǒng)”新體系架構除了進一步奠定數字化技術底座,還將有望重新激活核心板塊IaaS層、PaaS層的效能與高質量增長,大幅擴充技術增值服務,提升綜合毛利,最終帶動整個SaaS化生態(tài)的進程。
何以見得?
那你就應該意識到,新的體系架構在阿里云“IaaS+PaaS+SaaS化生態(tài)”中的價值。
CIPU顯然更多“做深基礎”,它更近IaaS層,飛天云操作系統(tǒng)則屬于PaaS層。
兩者結合,會發(fā)生什么呢?那就是:阿里云將有望借助新架構重新激活增長。
邏輯如此:截至目前,公有云IaaS層創(chuàng)造了阿里云最大比例的營收。但幾年來,基于傳統(tǒng)CPU的云計算體系架構,產品、服務相對標準,綜合毛利較低。而在度過阿里云1.0時代、奠定公有云市場地位后,增速已明顯放緩。由于營收占比較大,它決定著誕生以來阿里云的整體利潤結構。
而“CIPU+飛天云操作系統(tǒng)”新體系架構,將通過軟硬件結合,貫通IaaS+PaaS層最核心的部分,創(chuàng)造新的增長機制。
這里當然不會提供更精細的分析。但有必要做出提醒:“CIPU+飛天云操作系統(tǒng)”新體系架構下,云計算既滿足數據中心硬件資源高速云化,又滿足軟件定義的靈活性,聽上去是技術問題,其實是:
1、充分挖掘算力,減少內耗,降本增效。
要意識到,時延、數據、未被充分聚合的算力、能耗等都是復雜的交易成本。
“CIPU+飛天云操作系統(tǒng)”新體系架構本身也是降本增效的創(chuàng)新。短期也許它并不能真正改變阿里云IaaS層的成本結構,但由于這部分營收規(guī)模較大,只要成本稍有下降,綜合毛利率稍有提升,IaaS層的效益絕對值就會非常明顯。
當然也有其他配套的降本策略。阿里集團高級研究員、阿里云智能基礎產品事業(yè)部負責人蔣江偉介紹仁和數據中心時提到,最大規(guī)模的單相浸沒液冷數據集群,PUE可做到1.09,若全國數據中心都達到該值,每年節(jié)省的電量約等于三峽全年發(fā)電總量的2/3。
2、新體系架構也是LaaS層的新游戲規(guī)則,有利于提升阿里云的估值。
要意識到,走出CPU主導的體系架構,其實也等于有望走出后者主導的毛利結構。
世紀初,英特爾CPU與微軟windows構成的wintel聯(lián)盟,主導著整個行業(yè)的利潤結構。10多年前,前宏碁全球董事長王振堂曾對我說,CPU主導著25%以上。
新體系架構本身也是一種新的底層游戲規(guī)則。要知道,阿里云全球擁有眾多大規(guī)模數據中心,運營著200多萬臺服務器。“CIPU+飛天云操作系統(tǒng)”里,隱藏著無法回避的技術融合與系統(tǒng)集成服務。過往左右著利潤結構的CPU,雖然仍不可活躍,但只是一種算力的要素而已。隨著更多異構計算鏈接、納入,也包括阿里云自研產品的持續(xù)融入,IaaS層增收不增利的局面將會打破。未來,它本身也可能扮演利潤中心。
新架構意味著,阿里云IaaS層增長將有望被激活,毛利結構而PaaS層目前已成為阿里云核心利潤來源。這家公司已經連續(xù)6個季度保持盈利。
LaaS層與PaaS的架構創(chuàng)新,遠比應用層更難。“CIPU+飛天云操作系統(tǒng)”新體系架構的公布,有望成為重估阿里云價值的新的維度。
3、新體系架構下,為更多硬軟件網絡一體的云訂閱服務創(chuàng)造了巨大的增長空間。
這一點,你只要注意到持續(xù)升級的阿里云“無影”就能體會到。它不是簡單的PC概念,而是一種將軟硬件網絡服務納入整個云計算范疇的靈活的按需訂閱服務。
2020年,行癲將它定義為“云端一體”,從而與“云釘一體”共同構成了阿里云“一體兩翼”的服務。無影是阿里云服務輸出模式的重大創(chuàng)新。
由于這種輸出對于整個“云、網、邊、端”的整體協(xié)同高度依賴,“CIPU+飛天云操作系統(tǒng)”新體系架構的誕生,將會在后端云服務的集約性、技術、平臺體驗上帶來更多利好。
我記得,去年,行癲談到云計算時,還曾強調說,云計算正在呈現為軟硬件網絡一體的服務,“硬件也可以SaaS化”。
4、正在進一步協(xié)同、融合、打破邊界的“IaaS+PaaS+SaaS化生態(tài)”。
新架構給我們的一重啟示是,某種程度上,LaaS與PaaS的邊界正被打破。
或者說,兩者局部正在融合。
云計算已不是過往的結構與形態(tài)了,交匯處的創(chuàng)新空間巨大,未來的關鍵產品、毛利節(jié)點可能也會誕生在這里。
阿里云基礎產品首席架構師黃瑞瑞談到了趨勢變化。他說,針對核心應用,尤其當阿里云服務如此多客戶之后,后者訴求正逐步從“以業(yè)務邏輯為中心轉向數據處理為中心”。
這意味著,無論是硬件形態(tài)的CIPU,還是軟件形態(tài)的飛天云操作系統(tǒng),它們生成的架構,真正的價值流轉,圍繞的同樣是新一代以數據處理為中心的應用,只是各自分工不同。軟硬件網絡一體的云計算服務,整個鏈路的邊界越來越遵從應用、客戶為中心的視角。未來,三個層面的交界處會更加模糊。
而對于不做SaaS的阿里云來說,前兩者的創(chuàng)新將更加密集。過去兩年,除了底層的部分,我們確實看到阿里云很多軟硬件網絡一體的產品。看一眼6大產品線就明白:技術產品與基礎設施、邊緣云與云通信、數據管理服務、AI與機器學習、企業(yè)與媒體服務、IoT。
![]()
這種動向,契合著各種垂直行業(yè)數字化的空間。新架構創(chuàng)造了敏捷交付的機會。
阿里云看去已不像“云計算”了。行癲說,阿里云已是數字化基礎設施服務商,當然也可以叫“云計算”,只是云的價值鏈越來越長、越來越深、越來越寬。
這意味著阿里云的增長點將變得更加多元。而上述6條線并不包括釘釘單元。“云釘一體”下,釘釘的兩個數字化,與阿里云兄弟單元的產品,互相協(xié)同、補充甚至互為客戶關系。4月,釘釘一號位不窮坦陳,阿里云為釘釘奠定了很多客戶基礎,而釘釘也開始為阿里云創(chuàng)造新客戶。
剛才我們說“CIPU+飛天云操作系統(tǒng)”新體系架構有利于捕捉阿里云新的更高質量、更可持續(xù)的增長機制,有利于重估阿里云價值。我們認為,正在松動的三個層面的邊界,同樣為阿里云的增長打開了多引擎的空間。
我們甚至預判,不止產品創(chuàng)新,阿里云的組織架構,后續(xù)不排除也會因此出現新的升級。事實上,夸克也認為,“CIPU+飛天云操作系統(tǒng)”與其說是一種新體系架構,毋寧說是阿里云對于超大規(guī)模基礎設施的組織管理、整體運維到了一個精細化的時刻。它為外部提供數字化升級服務,事實上,升級本身也反映出,阿里云自身也已是一個巨大的數字化場景。這是原生的商業(yè)實踐。
你可能覺得,過于側重模糊的商業(yè)成效,可能有損一種新的體系架構創(chuàng)新的技術背景。
當然,我們從未否認過阿里云也是一家技術公司。
行癲此次強調說,新財年的基本策略是B2B(Back to Basic),回到云計算本質,也就是技術創(chuàng)新。我們當然理解此刻這一“做深基礎”動向背后更多的復雜背景。比如:
1、它事關阿里集團的戰(zhàn)略。
作為“內需、全球化、大數據與云計算”三大戰(zhàn)略之一的載體,阿里云既是主業(yè),也是未來的產業(yè)。作為技術與科技要素,它不僅事關阿里集團的業(yè)務增長,也是整個集團多元引擎架構持續(xù)落地的內在驅動力之一。
2022財年,阿里云營收若計入內部生態(tài)貢獻,已突破1000億,凈利潤超過11億。盡管無法與淘系相比,但它已成為中國零售版圖之外第二大的營收與利潤中心。
阿里集團AAC本地已達10億,全球13億,這也意味著本地的增長將進入結構性、存量深耕、內部互滲的周期。它對技術、組織協(xié)同提出了更高的要求。
2、新的體系架構,還對應著行業(yè)演進、政策風向、地緣政治等各種復雜的背景。
很多話題不用展開,就能理解此刻的技術創(chuàng)新之于大國的緊迫。其實,阿里集團三大戰(zhàn)略與整個國家目前的整體戰(zhàn)略幾乎完全一一映射。此外,我們還看到阿里云此次峰會多次強調安全,那就更為隱晦了。
峰會上,行癲等人有關阿里云軟硬件技術要素與能力的敘述還有更多。尤其CIPU生成背后的RDMA規(guī)模化、盤古存儲、神龍計算平臺、平頭哥、可編程SNA融合算力網關以及軟硬件一體的整體洛神網絡。
但阿里云始終也是一家商業(yè)公司。回歸云計算技術創(chuàng)新本質,不等于刻意忽視新財年第一場峰會中傳遞的增長動機。那恐怕并不真實。
夸克,最小的粒子,微末的洞察。
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.