網易首頁 > 網易號 > 正文申請入駐

終于，清華快手養出了通人性的AI！

2026-05-29 18:45:18　來源: 新智元

北京舉報

分享至

新智元報道

【新智元導讀】當推薦算法行業步入深度深耕階段，行業發展全新增長突破口在哪里？

多年來，短視頻推薦系統在協同過濾、序列推薦、多目標優化等方向上經歷了多輪技術迭代。

伴隨現有技術體系日漸完善，通過模型結構優化、常規特征開發、可觀測目標學習帶來的效能提升逐步放緩，行業亟需開辟創新研究思路。

清華大學經濟管理學院的陳柯均博士生、張佳音教授、徐心教授與快手消費策略算法部合作探索完成了一項聯合實驗：從視頻傳遞的價值觀的角度，去理解觀看視頻后用戶的行為和心理變化。

實驗嘗試利用大模型的模擬和推理能力，將社會學和心理學領域中的價值觀理論引入推薦排序策略，并在快手主站進行了大規模隨機在線對比實驗。

初步結果顯示，這一方向不僅技術上可行，更在用戶使用APP時長、電商、直播、社交、搜索等多個業務維度上實現了同步正向增長，創新性且系統性地實現了推薦系統在社會價值觀層面上通過算法手段滿足用戶需求的功能。

技術路徑

如何將抽象的價值觀概念從理論落地到推薦系統，是本項目需要解決的核心問題之一。

團隊基于前期合作的產出[1]，分兩個階段完成了視頻價值的大模型推理和輕量蒸餾模型線上生效的完整解決方案，將離線實驗驗證的方法論轉化為真實推薦系統的策略工具。

圖1–ValueOpt技術框架

大語言模型推理

團隊利用大語言模型模擬短視頻受眾群體，推理不同類型用戶在觀看視頻后的行為和心理變化，進而推斷用戶所能感知到的價值觀，大致方案沿用前期工作[1]。

完整的大模型推理流程針對部分隨機采樣視頻進行，采樣視頻時間跨度為6個月，視頻量累計超過650萬條，基本覆蓋全部類目。

注：實驗中團隊發現，提示大模型在過程中扮演短視頻相關受眾群體，能夠更好地從內容語義層面識別視頻所傳遞的價值觀信號，生成的標注結果會更準確地反映受眾側的感知結果。其中視頻受眾群體的提取在工程上采用了 TagCF[2] 方案，理論上也可以根據場景需求通過自定義的推理模版實現。

輕量蒸餾上線+策略對比試驗

為了應對每天數以千萬計的視頻理解需要，團隊進一步完成了蒸餾模型規模化部署。

模型以快手自研的視頻embedding為特征，以大模型推理結果為監督信號，訓練輕量級蒸餾模型，將大模型強大的受眾模擬和價值觀推理能力遷移到可實時在線高通量服務的小模型中，實現對全量視頻的價值觀標簽預估，從而具備多場景規模化應用的能力。

離線測試發現蒸餾小模型在充分訓練后可以達到85%以上準確率，人工評測也認為其與大模型推理結果無明顯差異，滿足線上落地需求。

視頻價值標簽預估結果在線上推薦系統生效時，存在另一個關鍵挑戰，即視頻價值與用戶可觀測反饋關聯的不可預知性。

雖然前期離線實驗已驗證視頻價值推理結果能夠有效提升視頻排序的準確率，但線上真實場景中用戶存在多種反饋信號（APP時長、點贊、關注、打賞、長期留存），目前也并沒有任何理論論證這些反饋信號與視頻價值的相關性和互補性。

此外，團隊也認為不同推薦業務場景下由于其作者生態和消費者群體不同，其價值內容也會呈現明顯差異，因此只有通過完整的線上對比試驗才能準確判斷系統隱藏的價值需求和短板。

線上落地實驗

實驗設計：億級用戶規模驗證

實驗在快手主站精選頁的重排階段進行，采用經典A/B實驗范式
實驗規模：每組約5%流量，每組覆蓋千萬級用戶群體
實驗周期：AA期觀察一周，AB實驗持續進行超過一個月
實驗干預：每個實驗組，在重排階段，適度提升某一類價值觀視頻的分發權重，觀察對各業務指標的影響

初步結果：多業務板塊同步增長

這是本研究最值得關注的發現——價值觀調控能夠拉動多個業務維度，且不同價值與多業務指標關聯存在差異。

內容消費：個人安全組，顯著提升了用戶APP使用時長及留存指標。
直播業務：多個價值觀組別（個人安全、傳統、仁慈-關懷等）對直播送禮金額有顯著正向影響。
電商業務：享樂主義、個人安全、社會安全等價值觀組別對大盤結算GMV有明顯正向貢獻，買家數也呈現同步增長。
社交互動：多個價值觀組別顯著提升了雙關用戶的內容互動與分享行為，平臺社交活躍度有所改善。
主動搜索：大多數實驗組均顯著提升了用戶主動搜索次數，其中刺激類價值觀視頻的提升幅度最為突出。

拓展討論和未來方向

為什么有效？一點理論解讀

這一系列結果背后，有兩個值得深思的發現。

其一，供需平衡需求。原有的推薦分發策略以主題作為內容的主要表征維度，視頻的價值觀屬性在分發過程中并未被顯式考量。

這意味著，某些價值觀類型的視頻，在平臺上的供給比例可能長期低于用戶的潛在需求——當我們主動提升這類內容的分發權重，用戶的正向反饋便隨之而來。

其二，價值觀的行為驅動力。本研究在全體用戶層面統一提升某類價值觀視頻的曝光比例。實驗結果表明，特定價值觀維度的內容在大盤層面更容易激發用戶的觀看、互動與轉化行為。

這一發現也具有一定的理論意義：它將社會心理學中成熟的價值觀理論與推薦系統的內容理解問題連接起來，同時也為價值觀理論本身提供了新的經驗證據——在數字內容消費這一大規模真實場景下，不同價值觀類型對人類行為的影響存在因果性、系統性差異，這是以往依賴問卷或小樣本實驗的價值觀研究所難以探討的問題。

意義與展望

這些發現的意義在于：人類的行為選擇背后，往往由深層價值觀驅動。不同價值觀類型的內容，在激發用戶消費、互動與轉化行為上存在系統性差異。

除視頻主題外，價值觀可以作為視頻內容的一個新維度，幫助推薦系統識別出那些在業務帶動上更具潛力的內容，并通過調整分發策略加以放大。

圖2 – 價值觀在用戶行為和心理轉化中的驅動性影響

此外，本研究展示了一個頗具潛力的方向：將人文社科領域的理論構念引入工業級推薦系統，為工業推薦場景提供了新思路、新視角。

當然，推薦系統作為整合并匹配生產者與消費者資源的核心算法節點，可能其內在本質上就是一個「研究人的學科」。

聯系方式

zhangjy5@sem.tsinghua.edu.cn

liushuchang@kuaishou.com

參考資料：

[1] Kejun Chen, Shuchang Liu, Jiayin Zhang, Zhitao Yin, Yandong Bai, Xin Li, Sean Xin Xu, Qing Yu, Xiang Li: Individualized Value Discovery using LLMs for Short Video Recommendation. ICIS 2025

[2] Qing Yu, Xiaobei Wang, Shuchang Liu, Yandong Bai, Xiaoyu Yang, Xueliang Wang, Chang Meng, Shanshan Wu, Hailan Yang, Huihui Xiao, Xiang Li, Fan Yang, Xiaoqiang Feng, Lantao Hu, Han Li, Kun Gai, Lixin Zou: Who You Are Matters: Bridging Topics and Social Roles via LLM-Enhanced Logical Recommendation. CoRR abs/2505.10940 (2025)

特別聲明：以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布，本平臺僅提供信息存儲服務。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.