![]()
開源數(shù)據(jù)庫與AI結(jié)合,將碰撞出怎樣的火花?
2026年,數(shù)據(jù)庫圈依然“戰(zhàn)事不斷”。一邊是開源社區(qū)對Oracle主導(dǎo)MySQL開發(fā)的不滿終于爆發(fā),一群核心用戶公開呼吁成立獨立基金會,擔(dān)心MySQL失去活力;另一邊,PostgreSQL的勢頭越來越猛,DB-Engines排名穩(wěn)居第四,成為主流關(guān)系型數(shù)據(jù)庫中增長最快的開源項目。
與此同時,更大的變量來自AI。Agentic AI時代,數(shù)據(jù)庫不再只是存數(shù)據(jù)的“倉庫”,而是開始變成AI代理的安全層、治理層和執(zhí)行層。當(dāng)以O(shè)penClaw為代表的各種龍蝦們(包括RDS也推出了RDSClaw)開始自主操作數(shù)據(jù)庫,傳統(tǒng)服務(wù)模式還能撐多久?這可能是很多數(shù)據(jù)庫產(chǎn)品不得不進行智能化變革的根本原因!
接下來,我們重點聊聊開源數(shù)據(jù)庫與AI結(jié)合,將碰撞出怎樣的火花?
過去,MySQL和PG被稱為是“絕代雙雄”。但兩款產(chǎn)品的發(fā)展境遇并不相同,PG如今已是AI新增項目的“新寵”,而MySQL的未來則充滿不確定性,8.0版本將在4月份終止社區(qū)支持。但有意思的一點是,MySQL突然在一段時間里“話鋒一轉(zhuǎn)”,成為AI增量客戶的“舊愛”。
AI時代,需要怎樣的開源數(shù)據(jù)庫?
MySQL是從什么時候開始迎來重要“反轉(zhuǎn)”的呢?此事還要從一個月前的AliSQL DuckDB全面開源說起!2026年2月份,阿里云瑤池數(shù)據(jù)庫迎來里程碑杯式事件,AliSQL社區(qū)一口氣開源三大能力:AliSQL DuckDB、AliSQL向量化引擎、AliSQL-CLI工具。這不是一次普通版本更新,而是數(shù)據(jù)庫領(lǐng)域的一次重要變革。
基于AliSQL最新開源能力,用戶可以用最短鏈路擁有AI就緒的數(shù)據(jù)底座;而對于DBA“老哥們”來說,也可以再“吃一波”MySQL技術(shù)紅利!
“今天的AliSQL已經(jīng)不再是原有MySQL的內(nèi)核級優(yōu)化,而是進化為AI時代最開放的數(shù)據(jù)底座。”阿里云數(shù)據(jù)庫產(chǎn)品事業(yè)部RDS產(chǎn)品部負責(zé)人陳宗志(花名:暴跳),在接受ITPUB獨家專訪時直言。
這句話的分量,圈內(nèi)人都懂。
一直以來,MySQL就像一個只擅長TP的“瘸腿巨人”,OLAP數(shù)據(jù)處理能力始終是短板。尤其在AI時代,MySQL的功能更新更是慢如“蝸牛”,無法滿足用戶AI就緒、AI原生目標(biāo),以至于有大量用戶在增量場景更愿意選用PostgreSQL。面對PG的大幅趕超,MySQL的關(guān)注度開始斷崖式下跌,有些聲音甚至認(rèn)為:MySQL不行了!
那么,AliSQL是如何“扳回一局”,讓MySQL“起死回生”,并獲得AI時代技術(shù)競爭力的呢?
首先,我們需要明確一個觀點,“不是PG搶了MySQL的存量市場,而是PG占據(jù)了AI時代的新增市場”,這個區(qū)別點至關(guān)重要!
在推進MySQL智能化變革這件事上,AliSQL可以說是“未卜先知”,精準(zhǔn)捕獲到市場動向。同時,受益于AliSQL與AMD的深度協(xié)作,聯(lián)合發(fā)布面向HTAP場景深度調(diào)優(yōu)的AliSQL DuckDB+ 9代AMD機的高性能分析解決方案,打造出了AI時代“性能組合拳”,使得MySQL在AI時代又重新迸發(fā)新的勃勃生機!
MySQL怎么就又“行”了?
“我不僅負責(zé)MySQL,我也負責(zé)PG團隊。”面對MySQL到底還行不行的質(zhì)疑,暴跳先“疊了個甲”。
確實,從市場發(fā)展現(xiàn)狀來看,PG在國外的流行度已超過MySQL,是過去十年中增長最快的數(shù)據(jù)庫之一。但從市場占有率來看,MySQL在2025年的市場份額為40-42%,遠高于PostgreSQL的17%。尤其在國內(nèi)商業(yè)化領(lǐng)域,MySQL在存量市場仍占據(jù)絕對優(yōu)勢。
而從技術(shù)變化的本質(zhì)來看,PG在AI時代流行,是因為它的插件化體系正好命中AI Agent的需求。因為,在AI Agent場景下,用戶更希望一個數(shù)據(jù)庫解決所有問題,不管是向量、文檔、全文檢索,PG都能在一個數(shù)據(jù)庫內(nèi)完成。雖然,PG的單項能力可能不是最優(yōu),但對AI Agent來說,夠用就好。反觀MySQL,擁抱AI也是大趨勢,但明顯節(jié)奏慢了許多,雖然MySQL9.0版發(fā)布了Vector數(shù)據(jù)類型與函數(shù),但僅支持HeatWave,也就是Oracle的企業(yè)版。
對于用戶而言,是不是可以放棄MySQL,選擇PG?顯然,這不是最明智選擇!不只是因為MySQL有大批存量客戶,更重要的是它有強大的在線數(shù)據(jù)處理能力。即便在今天這種大型互聯(lián)網(wǎng)交易業(yè)務(wù)場景,MySQL的高吞吐、高負載和高并發(fā)能力,也是無法取代。
既然MySQL依然重要,并想繼續(xù)向前發(fā)展,必然要走與PG相同的路線,那就是更好地去滿足AI Agent時代用戶對于數(shù)據(jù)庫的多樣化需求。這也是以AliSQL為代表的主流社區(qū)以及相關(guān)的內(nèi)核開發(fā)人員,正在努力的方向,希望通過向量化能力、CLI工具的支持,讓MySQL也能成為AI時代的第一選擇。
問題是,MySQL是一個傳統(tǒng)的關(guān)系型數(shù)據(jù)庫,引入向量引擎只是AI轉(zhuǎn)型的第一步,最重要的分析能力如何解決?換句話來說,在AI浪潮席卷全球的當(dāng)下,如何既保持MySQL的使用習(xí)慣,又能滿足分析性事務(wù)需求?
早期用戶會選擇拉長ETL數(shù)據(jù)鏈路的方式,實現(xiàn)“曲線救國”目標(biāo),比如:通過MySQL+ ClickHouse或者MySQL+ HBase的方式,滿足數(shù)據(jù)處理需求。同時,還有一部分用戶會走MySQL開源分支路線,比如:通過AliSQL、MariaDB這樣的開源產(chǎn)品,倒逼MySQL上游社區(qū)做出策略調(diào)整。
此次,AliSQL DuckDB開源,就是數(shù)據(jù)庫智能化變革的一個產(chǎn)物,也是MySQL與AI結(jié)合過程中用戶急需、但卻是最缺少的一些能力。
AliSQL做對了什么?
至于,AliSQL是誰?它和RDS又是怎樣一種關(guān)系?用戶在RDS和AliSQL之間該怎么選?這些問題看似簡單,但卻一直讓外界困惑!
“AliSQL是當(dāng)年阿里巴巴集團在去IOE大背景下孵化出來的MySQL獨立分支。RDS MySQL正是基于AliSQL內(nèi)核的商業(yè)化產(chǎn)品。”阿里云數(shù)據(jù)庫產(chǎn)品事業(yè)部RDS產(chǎn)品管理負責(zé)人許鴻斌(花名:洛霄)解釋道。
在人們的潛意識里,一般是先發(fā)展開源社區(qū),然后再從開源社區(qū)孵化出商業(yè)版。但對很多國內(nèi)互聯(lián)網(wǎng)大廠來說,剛好相反。一般是先做自己的商業(yè)版,然后再把一些社區(qū)需要的能力開放出來。RDS正式在此種背景下誕生,走的是先商業(yè)后開源路線。如今,AliSQL已經(jīng)成長為MySQL內(nèi)核優(yōu)化技術(shù)社區(qū)中不可或缺的一支重要力量。
AliSQL發(fā)展歷程如下:
2010-2015年:破曉誕生,去IOE攻堅
打造MySQL分支AliSQL,對淘寶商品庫進行改造,開始去IOE,承接原Oracle全部核心業(yè)務(wù),成功支撐雙11的數(shù)據(jù)洪流;
2016-2020年:全面開源,生態(tài)躍遷
AliSQL正式開源,從5.6迭代進入5.7和8.0時代,性能持續(xù)躍升,并衍生出許多商業(yè)化明星產(chǎn)品,成為云原生數(shù)據(jù)庫生態(tài)基石;
2021-2025年:主打融合和智能進化
首創(chuàng)融合DuckDB列存引擎,為MySQL體系注入開源HTAP能力,一份數(shù)據(jù)同時服務(wù)交易與分析,同時深度集成Vector向量索引,構(gòu)建AI應(yīng)用的數(shù)據(jù)基座,支撐語義搜索、大模型上下文管理等新興場景;
2026年:重啟,再創(chuàng),向新而生
AliSQL再度出發(fā),奔向下一代數(shù)據(jù)庫高地,AliSQL DuckDB、AliSQL向量化引擎、AliSQL-CLI三大能力開源,讓用戶擁有最短鏈路的AI就緒數(shù)據(jù)底座。
面向未來,AliSQL和RDS MySQL將是“雙軌并進”機制,如果你希望采用開源的技術(shù)棧構(gòu)建自己的數(shù)據(jù)鏈路,那你就選擇AliSQL,如果你覺得很多云上的定制化需求不適合開源,那就采用RDS。
DuckDB為什么重要?
值得一提的是,雖然AliSQL DuckDB剛剛開源,但并不是一個“實驗室”產(chǎn)品,已經(jīng)有很多知名企業(yè)通過RDS在實際生產(chǎn)場景使用了AliSQL DuckDB,比如:小紅書。
這里,需要明確的一個重要話題點是,DuckDB是怎樣一種存在,為什么對AliSQL如此重要?這要回到前文,依然是ETL問題!
AI時代,什么最重要?明顯是數(shù)據(jù)!打造智能數(shù)據(jù)底座需要什么?答案是:就緒速度!傳統(tǒng)的數(shù)據(jù)分析鏈路有多長?數(shù)據(jù)從MySQL導(dǎo)出,經(jīng)過ETL工具清洗轉(zhuǎn)換,加載到專業(yè)數(shù)據(jù)倉庫,再通過接口提供給AI模型訓(xùn)練。這一路下來,沒有三五個環(huán)節(jié)、不耗費幾小時甚至幾天,數(shù)據(jù)根本到不了AI模型里。
現(xiàn)在,有了AliSQL DuckDB,一切都變了。用戶可以直接在MySQL內(nèi)部完成數(shù)據(jù)分析,數(shù)據(jù)不再需要“搬家”,AI模型可以直接在數(shù)據(jù)庫內(nèi)部獲取訓(xùn)練數(shù)據(jù)。這個鏈路縮短了多少?你可以把它看作是“跨省物流”變成了“同城閃送”,用戶將用最短鏈路擁有AI就緒的數(shù)據(jù)底座。
想象一下,一家電商公司的推薦系統(tǒng)需要實時分析用戶行為數(shù)據(jù)。以前需要將數(shù)據(jù)同步到專門的數(shù)倉,現(xiàn)在直接在業(yè)務(wù)數(shù)據(jù)庫里就能完成分析,響應(yīng)時間從分鐘級降到秒級。這個速度差,在AI競爭白熱化的今天,在內(nèi)存和存儲大幅漲價的當(dāng)下,AliSQL DuckDB可能給了很多人一條活路。
用暴跳的話來說,DuckDB列式存儲引擎的引入,使得用戶可以在不改變現(xiàn)有應(yīng)用架構(gòu)的前提下,輕松獲得高達200倍的分析查詢性能提升。更重要的是,用戶可以使用MySQL協(xié)議、沿用熟悉的SQL語法、無需學(xué)習(xí)新工具、無需改造應(yīng)用程序。一鍵創(chuàng)建、自動同步、無縫切換,真正做到了“分析能力即服務(wù)”。
雖然,DuckDB是一家來自荷蘭的創(chuàng)新型數(shù)據(jù)庫產(chǎn)品,但也是穩(wěn)健、成熟的代表,以其輕量級設(shè)計和卓越的數(shù)據(jù)分析能力而著稱,目前已經(jīng)在GitHub上得到廣泛關(guān)注。為了進一步推動DuckDB社區(qū)的繁榮發(fā)展,AliSQL與DuckDB官方(DuckDB社區(qū)、DuckDB Labs.)簽署了戰(zhàn)略合作協(xié)議,雙方從Bug report、patch的提出,到品牌活動的開展等,都有深度合作。
當(dāng)然,軟件能力提升只是其中一個方面。在AI數(shù)據(jù)底座的構(gòu)建中,軟件能力再強,也離不開硬件算力的堅實托舉。當(dāng)AliSQL DuckDB將列式分析、向量化執(zhí)行與MySQL生態(tài)無縫融合時,一個更深層的命題浮出水面:如何讓這份“數(shù)據(jù)庫級智能”,真正跑在最適配的硅基引擎上?答案是——軟硬協(xié)同的深度優(yōu)化。
近年來,AliSQL也與AMD深度協(xié)作,聯(lián)合發(fā)布面向HTAP場景深度調(diào)優(yōu)的AliSQL DuckDB+ 9代AMD機的高性能分析解決方案,打造出了AI時代“性能組合拳”。受益于AMDEPYC高性能服務(wù)器CPU的代際持續(xù)迭代,第9代機型搭載的是第五代AMDEPYC處理器(代號為Turin)。在CPU的性能規(guī)格上,相比上一次Genoa(8代機型),在Zen架構(gòu),算力IPC,內(nèi)存帶寬和能耗上都有大的飛躍,9代AMD機依托的Zen5架構(gòu)比上一代Zen4的IPC綜合提升了17%,其中針對AI算力提升了37%,同時內(nèi)存的帶寬也提升了33%,支持了全鏈路的AVX512指令集,工藝節(jié)點上采用了更先進的TSMC 3nm/4nm工藝。收益于全新的CPU技術(shù),從而在標(biāo)準(zhǔn)TPC-H sf100基準(zhǔn)測試中,搭載9代AMD機型的AliSQL DuckDB集群,相較上一代機型(8代),整體分析查詢性能提升50%,查詢耗時也大大縮短。
為什么說AliSQL已從“MySQL內(nèi)核優(yōu)化”走向“超越”?
如果說DuckDB解決了分析能力問題,那么同期開源的AliSQL向量化能力則是數(shù)據(jù)庫變革的另一枚重磅“炸彈”。
AliSQL的向量化方案,是基于MariaDB方案的改進,并且直接集成到MySQL代碼中,性能對標(biāo)的是pgvector。更重要的是,它解決了用戶的現(xiàn)實痛點,如果你的數(shù)據(jù)都在MySQL里,既有向量需求又有標(biāo)量需求,沒必要再遷移到另一個數(shù)據(jù)庫。這樣傳統(tǒng)MySQL的DBA也能在AI時代進一步創(chuàng)造價值。
那么,有了AliSQL的向量化方案,傳統(tǒng)向量數(shù)據(jù)庫還有發(fā)展空間嗎?暴跳的觀點是,企業(yè)級應(yīng)用場景大部分是向量+標(biāo)量結(jié)合,即“先用標(biāo)量過濾,再用向量匹配”,有了AliSQL可以一體化實現(xiàn)向量+標(biāo)量數(shù)據(jù)的處理;但這并不意味著純向量數(shù)據(jù)庫會消失,比如:圖片相似度匹配等場景,就是純向量數(shù)據(jù)庫的“剛需”。這就像Elasticsearch和MySQL全文檢索的關(guān)系,大部分場景有MySQL的FTS就夠了,但少數(shù)專業(yè)場景需要專用引擎。
面對AI時代的數(shù)據(jù)底座構(gòu)建,除了用AliSQL DuckDB解決列存數(shù)據(jù)分析問題、用向量化方案支持向量數(shù)據(jù)的檢索,還有一個能力也特別重要——那就是智能CLI,這是讓大模型“聽懂”數(shù)據(jù)庫的關(guān)鍵能力。
“傳統(tǒng)的MySQL CLI工具,和大模型結(jié)合有門檻,新的智能CLI直接內(nèi)置了與大模型的連接能力。”洛霄解釋道。
如何理解智能CLI的工作原理?比如,你想知道今天MySQL為什么慢,可以直接在CLI里提問,工具會結(jié)合當(dāng)前情況,給出智能診斷和分析。更厲害的是,智能CLI可以用自然語言查詢,即便你不會寫SQL,也可以直接說“我想查什么”,系統(tǒng)會幫你轉(zhuǎn)換成SQL并執(zhí)行。有了智能CLI,可以大幅降低AI的使用門檻,哪怕是線下環(huán)境,也不用額外購買Agent產(chǎn)品,CLI直接幫你把數(shù)據(jù)和大模型結(jié)合。
開源意味著什么?如何看待MySQL社區(qū)的中國力量?
很明顯,AliSQL社區(qū)最新開源的諸多產(chǎn)品能力,都是MySQL走向AI時代的“必備武器”,已經(jīng)超越了一個普通分支社區(qū)的范疇。那么,AliSQL社區(qū)的未來定位是什么?在國際舞臺上扮演什么角色?
“我們從來沒定位自己只在國內(nèi)做社區(qū)。”暴跳的回答,暴露了AliSQL一個更大的“野心”。
可能很多人還不知道,暴跳是一個真正的“技術(shù)極客”,他曾是MySQL官方國內(nèi)Bug提交最多的開發(fā)者,如今也一直積極與國際社區(qū)交流,希望把AliSQL社區(qū)的最新方案貢獻到國際社區(qū),讓MySQL上下游生態(tài)繁榮發(fā)展。
眾所周知,Oracle裁了大量MySQL開發(fā)人員,這讓社區(qū)比較悲觀。對于很多做了十年內(nèi)核開發(fā)的老DBA來說,不希望社區(qū)走下坡路,甚至被時代拋棄。AliSQL社區(qū)的使命很明確,那就是給MySQL社區(qū)持續(xù)貢獻力量,讓它在AI時代“不掉隊”。
未來,AliSQL社區(qū)還有兩個重要的規(guī)劃方向:一個是與數(shù)據(jù)湖集成,讓AliSQL成為“對數(shù)據(jù)湖更友好的數(shù)據(jù)庫”。基于AliSQL,用戶就能把數(shù)據(jù)轉(zhuǎn)成Iceberg格式,存到S3或其他存儲中,下游的Spark、Flink、DuckDB都能直接分析,真正實現(xiàn)“一次寫入,多次分析”,徹底消除ETL流程;另一個是把更多企業(yè)能力開源,比如:把大事務(wù)優(yōu)化、秒殺場景優(yōu)化等企業(yè)版能力,逐步開源到社區(qū)版。
從收割MySQL的紅利,到把AliSQL的貢獻回饋給社區(qū),MySQL在AI時代的“反轉(zhuǎn)”,或許是中國開源力量成長的一個縮影。為了讓MySQL在AI時代崛起,AliSQL已經(jīng)邁出最堅實的一步!相信,AliSQL最新能力開源之后,不僅會讓MySQL社區(qū)走向繁榮發(fā)展的新征程;對于用戶來說,也將是一大福利,這意味著企業(yè)將以最短鏈路實現(xiàn)智能化數(shù)據(jù)底座的升級。
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.