![]()
出品|虎嗅商業(yè)消費(fèi)組
作者|苗正卿
題圖|視覺中國
如何讓一艘正在航行的巨型輪船,在保持前行的同時“換上”新引擎?
這是擺在23歲淘寶面前的“歷史級考題”:擁有10億年度活躍用戶、300余萬商家、6.5萬億年GMV的淘寶,需要完成一場AI升級。而考題的難點(diǎn)在于,它要一邊確保業(yè)績穩(wěn)中有增,一邊確保用戶和商家感覺不到“升級陣痛”。
虎嗅獨(dú)家獲悉,2024年12月,淘天決策層針對AI升級進(jìn)行了多次會議,經(jīng)過討論后,內(nèi)部逐漸梳理出三件“最具確定性”的需要通過AI升級的事情:1.大幅度提高流量匹配效率(搜推廣) 2.為商家增效降本 3.新的AI導(dǎo)購產(chǎn)品。而在2025年3月,三件事陸續(xù)啟動。
整個過程,采用了AB測試、灰度上線等阿里傳統(tǒng)打法。虎嗅了解到,上述三個事情,幾乎并行。由阿里巴巴中國電商事業(yè)群搜推智能事業(yè)部和CTO技術(shù)線共同牽頭,多個兄弟部門協(xié)同推動。
從虎嗅視角觀察,這個過程是非常謹(jǐn)慎的。有知情人士告訴虎嗅,所有AI相關(guān)新功能、工具,都會從2%用戶量這個階段開始測試。常見的模式是,采用了新AI產(chǎn)品的2%用戶會被納入到一段為期數(shù)周的觀察期。在這兩周之內(nèi),技術(shù)團(tuán)隊(duì)、數(shù)據(jù)團(tuán)隊(duì)等部門會連夜復(fù)盤,并研究消費(fèi)者體驗(yàn)變化背后的原因。
如果一個AI功能或產(chǎn)品,在2%用戶量的維度獲得了不錯的反饋,那么接下來會進(jìn)入5%、10%直到50%的漫長測試周期,直到50%這個量級測試依然展現(xiàn)出良好的結(jié)果,這個產(chǎn)品/工具才能全量上線。
伴隨這個過程的,是幾個“過去十幾年少有的大項(xiàng)目”的誕生。其中的代表項(xiàng)目是“商品庫”。在過去23年,淘寶積淀了龐大的商品信息庫,但傳統(tǒng)的商品信息和淘寶迫切希望引入的生成式AI大模型之間存在“代溝”——過于潦草、錯誤的商品信息,無法讓大模型理解、學(xué)習(xí),也無法讓大模型發(fā)揮出真正的實(shí)力。
但徹底改造數(shù)以幾十億級的商品信息庫無疑是個大工程。虎嗅了解到,淘天把AI作為生產(chǎn)力引入到這個超級工程之中。團(tuán)隊(duì)開發(fā)了單獨(dú)的AI Agent去自動學(xué)習(xí)、撰寫商品信息,然后AI Agent還會完成復(fù)查環(huán)節(jié),基于AI助力,這個在人工時代“多年未解決”的難題,在數(shù)個月時間里得到了顯著效果。而基于這個新商品庫,淘天重新引入了基于大模型的“搜推廣”體系,改變了舊有的流量分配生態(tài)。
虎嗅獲悉,自3月開始,淘天陸續(xù)完成了商品庫、六個AI創(chuàng)新產(chǎn)品(AI萬能搜、AI Summary、拍立淘、AI幫我挑、AI試衣、AI清單)、搜推廣體系長尾詞復(fù)雜詞AI升級、商家AI工具升級等一系列工作。從數(shù)據(jù)看,這些動作帶來了流量匹配效率雙位數(shù)增長。據(jù)悉,淘寶復(fù)雜語義下搜索相關(guān)性提升了20個百分點(diǎn),推薦信息流點(diǎn)擊量提升10%,商家廣告ROI提升12%。
10月16日,虎嗅在天貓雙11發(fā)布會上獲悉,2025天貓雙11將在10月20日晚上8點(diǎn)開賣,今年將是首個AI全面落地的天貓雙11。在用戶側(cè),六款A(yù)I創(chuàng)新產(chǎn)品已經(jīng)在雙11前上線或開啟內(nèi)測;在搜推廣體系,淘天在雙11前已經(jīng)完成了包括復(fù)雜詞在內(nèi)的幾個重點(diǎn)AI升級項(xiàng)目。而有品牌商家告訴虎嗅,在今年雙11前,商家后臺已經(jīng)出現(xiàn)了超過至少10款新的AI工具。
AI顯然已經(jīng)成為本屆雙11,和當(dāng)下淘寶天貓進(jìn)化的關(guān)鍵詞。
在16日早些時候,虎嗅與阿里巴巴中國電商事業(yè)群搜推智能總裁凱夫進(jìn)行了獨(dú)家交流,這是今年6月份虎嗅與凱夫交流阿里國際AI升級后的再次深入溝通。凱夫分享了他對于淘天AI升級的思考,以及他們在整個過程中的一些基本的、關(guān)鍵的邏輯,下附交流實(shí)錄,有刪減:
虎嗅:2024年雙11后,您回歸淘天帶隊(duì)推動AI升級,你們團(tuán)隊(duì)思考AI進(jìn)化的整個脈絡(luò)是怎樣的?重點(diǎn)做了哪些事?
凱夫:我覺得本質(zhì)上關(guān)鍵的是圍繞三件事。第一個是“搜推廣”的AI升級,也就是在搜索、推薦、廣告三個方面大幅度提高流量匹配效率;第二個是為商家增效降本,這里面包括了很多toB的AI工具,比如美工、客服這些環(huán)節(jié);第三個是AI創(chuàng)新產(chǎn)品,主要是一些新的AI導(dǎo)購產(chǎn)品,比如我們的AI萬能搜、AI助手。
虎嗅:這三件事有優(yōu)先級嗎?你們內(nèi)部啟動的時間點(diǎn)是有前后順序的,還是幾乎同步?
凱夫:是同時去做的。同時開始討論,同時立項(xiàng)。我們大部分的討論,是在2024年12月就開始了,然后在年初基本上都定下了基本的思路。這三件事,我們整體上是從3月份著手去做的。
虎嗅:為什么選擇這三件事去做?
凱夫:搜推廣的AI化是我們非常有確定性的一件事。因?yàn)樗淹茝V是所有電商平臺的核心,一個電商平臺最重要的其實(shí)就是它的商品體系加上搜索、推薦、廣告,這構(gòu)成了電商平臺的核心引擎。搜推廣體系的效率和能力,直接決定了消費(fèi)者能不能找到想要的商品、決定了商家有沒有流量。
其實(shí)早在生成式AI誕生前,“搜推廣”就已經(jīng)是機(jī)器學(xué)習(xí)最重要的應(yīng)用場景之一。當(dāng)生成式AI出現(xiàn)后,針對“搜推廣”的AI化,其實(shí)有兩種思潮。
第一種思潮認(rèn)為,搜推廣和生成式大模型是兩條路,也就是說不要把二者融合,而是單獨(dú)去基于大模型做一些新的東西。第二種思潮,則是想把商品當(dāng)成token,用生成式大模型next token prediction的范式徹底改造搜推廣。
這兩種思考,其實(shí)本質(zhì)上都有各自的問題。第一個的問題在于,它把這兩件事看得太割裂了;第二個的問題在于,過于理想主義,步子邁太大了。
所以2025年初,我們做的第一個決定是,認(rèn)為搜推廣是大模型最好的應(yīng)用場景,我們決定把跟大模型相關(guān)的算力、資源投入到搜推廣這件事上。
此后我們做了第二個決定,就是到底怎么投入。我們思考后認(rèn)為,不能像“科幻小說”那樣迅速完成徹底的、未來的改變,而是要基于現(xiàn)有體系做融合,也就是把大模型的能力加進(jìn)來。
我舉個例子,搜推廣有很多環(huán)節(jié),從當(dāng)下最優(yōu)解去看,并不是說所有環(huán)節(jié)都大模型化就最佳。比如索引環(huán)節(jié)我可以用大模型、相關(guān)性判斷環(huán)節(jié)我可以用大模型,但在個性化預(yù)估環(huán)節(jié)我其實(shí)用以前的稀疏模型也是可以的。簡單來說,一些必須依靠大模型去升級的環(huán)節(jié),我們?nèi)プ錾墸⒎侨嫱品酝逆溌贰_@是一種務(wù)實(shí)的方法。
這里面還有很多精細(xì)化的做法。比如我們會把大模型的能力蒸餾到相對小一點(diǎn)的模型上,簡單說就是用大模型當(dāng)老師來教小模型。
我來總結(jié)一下,在第一件事“搜推廣”AI升級上,我覺得有兩個關(guān)鍵點(diǎn),第一是要把大模型用到搜推廣之中去;第二是,不要做理想主義、不要追求一步到位的系統(tǒng)性替代,而是做融合,讓傳統(tǒng)架構(gòu)和新架構(gòu)各自解決擅長的問題。
第二件事是商家側(cè)的AI進(jìn)化。這包括了各種AI工具,這其實(shí)涉及了過去20多年阿里的一系列積淀。比如我們的店小蜜,我們很早就有這個產(chǎn)品了,只是之前用的是規(guī)則式NLP技術(shù),今天我們把大模型用進(jìn)來了。這部分其實(shí)比較好理解,我就不展開了。
第三件事就是我們的AI創(chuàng)新產(chǎn)品。我們在今年七月、八月、九月一直在測試、上線各種AI產(chǎn)品,我們最早的初衷肯定是希望這些AI產(chǎn)品能帶來一些以往完全沒有的體驗(yàn)。
我覺得這些產(chǎn)品背后,我們有兩個共性的關(guān)鍵邏輯,其一是我們希望每個產(chǎn)品去解決一個用戶痛點(diǎn)。我們沒有去追求一個特別理想主義或者原教旨主義的東西,而是想解決問題。比如我們AI萬能搜想解決復(fù)雜場景下商品推薦問題或者說需求發(fā)現(xiàn)問題。比如AI助手,我們解決的是挑選難度的問題。
第二個關(guān)鍵邏輯是,我們在做一個取舍:到底是把AI產(chǎn)品、工具融入到主產(chǎn)品的使用場景之中去,還是說以“一個超級入口”形式去通過對話解決所有問題。
我們選擇融入使用場景。當(dāng)然這個不絕對,但我們大部分AI創(chuàng)新產(chǎn)品,是融入或嵌入到使用場景里的,而不是通過一個獨(dú)立入口去做。這背后的決策因素和淘寶用戶天生的動線、習(xí)慣有關(guān)。我們需要把AI的能力,沉浸式埋入到場景里。
虎嗅:你講的這三件事,感覺更像是水面上的冰山,水面下似乎還有很多你們做的事情。比如你們今年花了很大精力做升級商品庫?(虎嗅注:從2025年初開始,淘天把過去二十余年積淀的商品信息庫,做了AI升級,補(bǔ)充了大量更符合大模型學(xué)習(xí)、理解的商品信息,也做了二十余年來最大規(guī)模的一次徹底梳理)
凱夫:你說得很對。我以搜推廣為例,商品庫其實(shí)就是搜推廣這件事水面下的部分。因?yàn)樯唐穾焓俏覀冏鏊淹茝VAI升級的先決條件。
搜索最簡單的工作原理,就是以搜索詞為出發(fā)點(diǎn),用戶問一個詞,然后引擎把這個詞和商品做匹配。這里面關(guān)鍵點(diǎn)在于商品信息。如果你的商品信息是豐富的、準(zhǔn)確的,那么模型、算法是容易理解的,但如果商品信息缺失或者錯誤,模型和算法是無法理解的。
簡單來說,需要想辦法讓商家盡量多地寫商品信息。寫得越清楚、越明白,我們就越容易用大模型把用戶需求和商品精準(zhǔn)匹配起來。那么怎么去豐富這些信息呢?我們叫底層數(shù)據(jù)格式的標(biāo)準(zhǔn)化。以往我們需要用大量人工,去一點(diǎn)點(diǎn)查資料、詢問用戶或者商家,然后補(bǔ)充信息。我們今年通過AI去自動豐富、補(bǔ)全信息,最終重新梳理了整個商品庫的底層索引。
這是淘天的一個超級大項(xiàng)目,牽扯到技術(shù)、業(yè)務(wù)很多團(tuán)隊(duì)。而且這是一個缺少了AI沒法做的事情。我給你舉個例子,在2010年、2011年,淘寶小二每天在做豐富商品信息這件事時,會去買百科全書,比如服飾小二,可能就會買一本紡織工業(yè)百科全書,然后去查詢品類商品所包含的關(guān)鍵屬性。
我們今年用了一個AI Agent。如果沒有這個AI Agent,我們想重新梳理整個商品庫信息,我跟你講我們都雇不起那么多的小二人工,那是一個巨大的工程。但AI Agent可以24小時工作,小二只需要去調(diào)教AI Agent就可以了。
虎嗅:我想追問一下,就比如你剛剛講的這個用AI Agent去豐富商品庫的細(xì)節(jié),這是一個今年做時機(jī)恰好的事情,還是說其實(shí)去年做更好?
凱夫:這可能是一個天時地利人和的事情。2024年我們團(tuán)隊(duì)有一些積累,但2025年技術(shù)更成熟、技術(shù)成本更低。或者說,這件事在2025年的成熟度更高了。需求場景存在、技術(shù)成本下降、團(tuán)隊(duì)組織的共識更強(qiáng),所以今年做這個事情挺合適。
虎嗅:我回到主線,聽你剛才講的三件事以及水面下的事情。感覺比較像是高速路上行駛的汽車要同時換引擎?
凱夫:我覺得換個比喻更合適,我們可能更像是一艘船,然后船一直在前行,我在舊引擎旁邊安裝了一個新引擎。等于我沒有卸下之前的引擎,我裝了倆。
我們在做所有產(chǎn)品技術(shù)升級時,我們傳統(tǒng)的業(yè)務(wù)都在跑。我們一路是靠不斷的AB測試,一點(diǎn)點(diǎn)去推動進(jìn)化的,測試后數(shù)據(jù)說話。
虎嗅:你剛才提到的商品庫,感覺它其實(shí)是未來若干年淘天生存發(fā)展的一個新基礎(chǔ)設(shè)施?
凱夫:你可以這么理解。
虎嗅:那今年你們做的這些事情或者項(xiàng)目,還有什么可以屬于這個范疇?
凱夫:我覺得整個搜推廣都屬于這個范疇,這是非常底層的大基建。
虎嗅:這些事情,都是過去八個月左右完成的?
凱夫:我們之前有過一些討論,然后開始做是三月份。搜推廣整體的進(jìn)化,其實(shí)是一個連續(xù)的過程,之前幾年我們也在不斷更新。但今年三月份開始,我們在搜推廣上開始有比較大規(guī)模的投入,包括針對大模型的算力、資源的投入。
但我覺得,很多事情,確實(shí)是淘天這些年動作的延續(xù)。比如生意參謀、店小蜜我們都做了很多年了。今年跟以往業(yè)務(wù)節(jié)奏上的差異,我覺得是大項(xiàng)目多一些,比如商品庫就是大項(xiàng)目。
虎嗅:大項(xiàng)目你們是怎么定義的?
凱夫:就是時間長、投入的資源人力多,一般都是一些相對底層的東西。我們今年團(tuán)隊(duì)的勇氣確實(shí)是值得嘉獎的,因?yàn)槲覀兲魬?zhàn)了一些以往很多年沒動的事情。商品庫其實(shí)我們過去十幾年并沒有大的質(zhì)變。
虎嗅:聽你剛才分享的內(nèi)容,這種大項(xiàng)目少不了AI這個生產(chǎn)力。之前和你聊,你并沒有通過OKR這些手段去強(qiáng)推團(tuán)隊(duì)用AI工具,今天你依然保持這個思路嗎?
凱夫:我更希望大家是需求驅(qū)動。以商品庫這件事為例子,其實(shí)根本不需要定一個AI工具相關(guān)OKR,因?yàn)闆]有AI這件事是做不出來的。
虎嗅:從外界視角看,你們做的這些事情,其實(shí)是“動筋動骨”的,但同時你們要確保用戶體感在線。這種平衡是怎么保持的?
凱夫:我們是逐步“切流”,通過新老并存的方式去一點(diǎn)點(diǎn)測試,我們叫灰度上線。其實(shí)這些事情,也是靠一個個補(bǔ)丁打起來的。
如對本稿件有異議或投訴,請聯(lián)系tougao@huxiu.com
End
特別聲明:以上內(nèi)容(如有圖片或視頻亦包括在內(nèi))為自媒體平臺“網(wǎng)易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務(wù)。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.