<ruby id="9ue20"></ruby>

  1. 
    

      国产午夜福利免费入口,国产日韩综合av在线,精品久久人人妻人人做精品,蜜臀av一区二区三区精品,亚洲欧美中文日韩在线v日本,人妻av中文字幕无码专区 ,亚洲精品国产av一区二区,久久精品国产清自在天天线
      網易首頁 > 網易號 > 正文 申請入駐

      越懂你,越危險?MemPrivacy揭示AI記憶下一站

      0
      分享至



      機器之心發布

      AI 記憶時代 ,Agent 越來越像一個真正的私人助理。

      它記得你的習慣,知道你的日程,理解你的健康狀態,甚至能在長期對話中逐漸形成一套關于你的「個人畫像」。但問題也隨之而來:如果這些記憶都要上云,隱私還安全嗎?

      4 月 22 日,OpenAI 開源了一個名為privacy-?lter的輕量級隱私過濾模型,試圖解決大模型系統中的 PII 檢測與脫敏問題。



      • OpenAI Privacy Filter 地址:https://openai.com/zh-Hans-CN/index/introducing-openai-privacy-filter/

      僅僅兩周后,記憶張量 MemTensor 團隊拿出了一個更激進的答案。該方案由記憶張量 MemTensor 與榮耀 HONOR 團隊聯合研發,同濟大學也參與其中 —— 這也是端側廠商與記憶基礎設施團隊首次在「Agent 隱私」這件事上深度合作。

      他們正式開源了面向端云協同 Agent 的隱私保護框架與系列模型MemPrivacy。更令人意外的是,在同樣的真實對話隱私提取任務上,MemPrivacy 的 F1 分數最高比 OpenAI privacy-filter 高出50.47 %

      這并不是一次臨時跨界。

      在此之前,記憶張量已經推出 MemOS,把 Agent 記憶從向量庫或 RAG 插件,提升為可管理、可調度、可演化的系統資源:記什么、怎么檢索、如何更新、如何治理,都被放進一套「記憶操作系統」里。

      MemPrivacy 更像是 MemOS 往端云協同場景自然長出的隱私層 —— 當 Agent 開始長期記住用戶偏好、健康狀態、賬號憑證和工作上下文時,問題就不只是「能不能記住」,而是「能不能安全地記住」。這也讓記憶張量做 MemPrivacy 顯得順理成章:它不是從通用 PII 打碼出發,而是直接從 Agent 長期記憶的真實使用場景出發,重新定義隱私類型、保護級別和占位符機制。





      發布當天,MemPrivacy 即上榜 Hugging Face Daily&Weekly Papers TOP1。

      這不是一個簡單的「隱私打碼工具」。

      它瞄準的是下一代個性化 Agent 最核心、也最棘手的問題:如何讓云端大模型繼續擁有長期記憶和個性化能力,同時又不讓用戶的敏感數據真正離開本地?

      換句話說,MemPrivacy 想做的事情是:讓 Agent 可用,但不可見。



      • 論文標題:MemPrivacy: Privacy-Preserving Personalized Memory Management for Edge-Cloud Agents
      • 論文地址:https://arxiv.org/pdf/2605.09530
      • 代碼倉庫:https://github.com/MemTensor/MemPrivacy
      • 模型倉庫:https://huggingface.co/collections/IAAR-Shanghai/memprivacy

      OpenAI 入局

      但 8 個標簽撐不起 Agent 的長期記憶

      OpenAI 的 privacy-filter 思路很簡單:掃描文本,識別隱私片段,然后替換成語義標簽。

      比如,把用戶輸入中的人名「Maya」替換成 [PRIVATE_PERSON]。

      這套模型擁有 1.5B 參數,其中激活參數約 50M,采用雙向 Token 分類架構,支持 128k 上下文,主打高吞吐量 PII 檢測與掩碼。

      相比傳統一律替換成 *** 的打碼方式,這當然已經進了一步:它至少保留了一部分語義。

      但放到端云 Agent 的長期記憶場景里,問題很快暴露出來了。

      OpenAI privacy-filter 只提供 8 類基礎隱私標簽。對于普通表單脫敏,這也許夠用;但對于一個需要理解用戶、長期記憶用戶、甚至調用工具替用戶執行任務的 Agent 來說,這個粒度太粗了。

      銀行卡號、社保編號、項目檔案號,可能都會被塞進同一個 [ACCOUNT_NUMBER]。登錄密碼、數據庫憑證、API Key、內部密鑰,也可能統統變成 [SECRET]。

      這就像把所有危險物品都貼上「危險」兩個字。

      安全是安全了一點,但語義也被抹平了。

      真正的問題在于,Agent 不是數據庫清洗腳本。它需要理解上下文、保留關系、形成記憶,并在未來的對話中繼續使用這些信息。

      當用戶說「我的血壓今天是 160/110」時,這不是普通數字,而是健康指標;當用戶說「這是我公司數據庫的連接串」時,這也不是普通文本,而是高危憑證。粗粒度標簽一旦識別不到,就會漏;一旦識別錯,就會毀掉語義。

      于是,隱私過濾進入了一個兩難局面:

      漏判,用戶隱私裸奔;誤判,Agent 當場失憶。

      這正是下一代個性化 Agent 最難繞開的矛盾。

      MemPrivacy 登場

      不是抹掉隱私,而是給隱私換一張「本地身份證」

      記憶張量 MemTensor 團隊提出的 MemPrivacy,核心思路叫做:本地可逆偽匿名化

      它不是把隱私信息簡單刪除,也不是替換成無意義的星號,而是在端側完成一次更精細的「偷梁換柱」。



      整個流程可以拆成三步。

      端側上行脫敏

      用戶在手機、PC 等邊緣設備上與 Agent 對話時,本地會先運行一個輕量級 MemPrivacy 模型。它負責識別對話中的隱私片段,并根據用戶設置的保護等級進行處理。

      如果文本里出現「我的血壓今天是 160/110」,MemPrivacy 不會直接把它變成 ***,而是替換為類似

      這樣的細粒度類型化占位符。

      真實血壓值與占位符之間的映射關系,只保存在本地數據庫里。

      云端安全處理

      云端大模型看到的是:「我的血壓今天是

      。」

      它看不到 160/110 這個明文敏感數據,但依然知道這里是一個健康指標,因此可以繼續進行推理、生成建議、形成記憶,甚至調用相關工具。

      第三步,端側下行恢復

      當云端回復「您的血壓

      偏高」時,本地系統再把占位符恢復成真實數值,最終呈現給用戶。

      在用戶體驗上,這個過程幾乎是透明的。

      但在系統架構上,關鍵敏感數據從未真正離開本地。

      這就是 MemPrivacy 最重要的設計:讓云端看懂結構,但看不到明文

      三種路線對比

      無保護裸奔,全過濾失憶,MemPrivacy 保留智商

      在端云 Agent 場景里,傳統隱私保護大致有兩種極端方案。

      第一種是無保護。

      用戶原始數據直接上云。云端模型當然可以完整理解上下文,個性化效果最好,但健康數據、私人郵箱、家庭住址、賬號憑證等敏感信息也會完整暴露。

      在數據合規越來越嚴格的今天,這幾乎是在走鋼絲。

      第二種是完全過濾。

      所有隱私內容都被替換成 *** 或直接刪除。看起來很安全,但代價是 Agent 徹底失去關鍵語義。用戶想讓它記住健康狀況、財務約束、工作上下文,它卻只能看到一片空白。

      這類 Agent 看似安全,實際上已經喪失了「長期個性化」的基礎。



      MemPrivacy 選擇的是第三條路:細粒度類型化占位符

      云端不知道你的真實血壓是多少,但知道這是一個健康指標;不知道你的私人郵箱是什么,但知道這里有一個郵箱;不知道你的 API Key 明文,但知道這里是一個高危憑證。

      這種設計保住了兩個東西:一是隱私邊界,二是語義結構。

      也正因如此,MemPrivacy 才有機會在隱私保護和 Agent 效用之間取得平衡。

      硬核實力

      F1 分數甩開 OpenAI 超 50 點,完爆 GPT-5.2

      為了驗證 MemPrivacy 的能力,研究團隊構建了一個新的評測基準MemPrivacy-Bench。這個基準覆蓋 200 個用戶的對話歷史,包含超過 15.5 萬個隱私項,并支持中英雙語隱私信息檢測。

      此外,為了測試泛化能力,團隊還在外部個性化長文本對話數據集PersonaMem-v2上進行了 OOD 交叉測試。

      在這兩大基準的提取準確率(隱私文本、級別、類型的綜合 F1 分數)較量中,MemPrivacy 均展現出了碾壓級的優勢:



      遠超 OpenAI 專項模型:

      在 MemPrivacy-Bench 上,OpenAI privacy-filter 的綜合 F1 分數只有35.50%

      而 MemPrivacy-4B-RL 達到了85.97%,兩者差距高達驚人的50.47%!即使是在跨分布的 PersonaMem-v2 數據集上,MemPrivacy 依然領先 OpenAI 近 9%。

      原因也很清楚:OpenAI privacy-filter 的優勢在速度,非自回歸 Token 分類架構帶來了很高吞吐量;但它的問題在于標簽覆蓋窄、顆粒度粗,對復雜上下文和中文場景的適配不足。

      MemPrivacy 則針對 Agent 長記憶場景重新定義了隱私類型、保護級別和訓練目標,因此在真實對話中更接近實際需求。

      更有意思的是,MemPrivacy 不只是贏了 OpenAI 的專項小模型。

      越級挑戰通用大模型:

      即使面對參數量極其龐大的最強通用模型 GPT-5.2、Gemini-3.1-Pro 以及 DeepSeek-V3.2-Think,MemPrivacy-4B 乃至僅有 0.6B 的微型版本在兩個數據集上均實現了碾壓。

      這說明,隱私提取不是簡單堆大參數就能解決的問題

      它更像一個高度結構化、強約束、強邊界感的任務。真正重要的不是模型有多大,而是它是否理解「什么信息該被保護、該保護到什么程度、保護后還能不能繼續被 Agent 使用」。

      不讓 Agent 變傻

      系統效用損失最低不到 1%

      隱私保護還有一個更現實的問題:保護得再好,如果 Agent 變傻了,也是白搭。

      這也是很多粗暴脫敏方案的死穴。

      用戶說:「我最近血壓偏高,幫我記住,以后安排運動計劃時注意一點。」

      如果系統把血壓、健康狀態、運動偏好全部抹掉,云端模型當然安全了,但它也沒法再提供真正個性化的服務。

      MemPrivacy 的類型化占位符真的能保留記憶系統的效用嗎?

      團隊在業界幾個主流記憶系統平臺上進行了端到端測試。所有底座均采用統一的 GPT-4.1 模型。



      實驗結果令人振奮:

      • 當采用傳統的不可逆掩碼(Irreversible Masking)時,三大記憶系統的準確率分別暴跌了 26.67%、41.87% 和 16.99%,模型幾乎處于失憶的癱瘓狀態。
      • 在 MemPrivacy 保護下(最高防御級別 PL4+PL3+PL2 全開),系統效用損失被死死控制在0.71% ~ 1.60%之間。如果用戶僅選擇保護最高風險的憑證級隱私(PL4),準確率下降甚至不到 0.89%

      這意味著,MemPrivacy 真正做到了在不傷害智能體智商的前提下,把隱私泄漏風險降到了最低。

      這正是 MemPrivacy 的關鍵價值:它不是在「安全」和「智能」之間二選一,而是試圖把兩者拆開 —— 明文不上云,但語義仍然可用。

      四級隱私樹

      終于把「什么是隱私」講清楚了

      MemPrivacy 能做到這一點,背后一個重要原因是:它沒有把隱私當作一個簡單的二分類問題。

      傳統隱私過濾常常是「要么脫敏,要么全明文」。但真實世界遠比這復雜。

      MemPrivacy 引入了以可識別性、潛在危害性與可利用性為準繩的四級隱私分類法 (PL1-PL4),從而支持用戶根據需求自由調控脫敏閾值:



      PL4 致命核心級(最高警戒憑證與機密)

      這一層包括明文密碼、驗證碼、Session、Cookie、API Key、內部商業機密等。一旦泄露,就可能導致賬戶接管、資金盜刷、系統越權或大規模數據泄露。

      這類數據一旦檢測到,系統將實行 “絕對零容忍” 攔截,嚴禁進入云端上下文。

      PL3 高危敏感級(引發生命財產風險的紅線數據)

      包括身份證件號、詳細醫療診斷、生理指標、精準軌跡定位、生物特征、敏感消費記錄等。它們不一定直接等于賬號權限,但足以對人身安全、財產、健康和聲譽造成實質傷害。

      PL2 身份錨定級(可溯源的標識信息)

      包括真實姓名、詳細地址、手機號、私人郵箱、IP 地址、社交賬號等。單獨或組合起來,可以定位到具體自然人。尤其是「公司 + 職位 + 姓名」這類組合,在真實場景中也具備很強的可識別性。

      PL1 基礎畫像級(安全可用的個性化基石)

      包括作息習慣、興趣偏好、非診斷性情緒、表達風格等。這類信息是個性化 Agent 的基礎,一般不會帶來實質傷害,因此可以安全用于長期記憶。

      這套分層設計的意義在于 —— 它讓隱私保護不再是一把錘子。

      同樣是消費記錄,「在超市花了 86 塊錢」可能只是日常偏好;但某筆帶有明確醫療屬性的消費,則可能進入 PL3。

      同樣是數字,有些只是普通計數,有些卻是血壓、身份證號、驗證碼或 API Key。

      這就是細粒度隱私識別真正困難的地方:模型必須理解語義、上下文、風險和用途。

      兩階段訓練

      讓模型真正理解隱私邊界

      在模型訓練上,MemPrivacy 采用了 Qwen3 系列作為基座,覆蓋 0.6B、1.7B、4B 多個規格。

      訓練過程分為兩個階段。

      第一階段是 SFT。

      團隊使用 26K 高質量多輪對話數據進行監督微調,讓模型掌握基礎的隱私定位、類型識別和占位符替換能力。

      第二階段是 GRPO 強化學習。

      團隊引入基于結構化 Reward 的策略優化,用提取結果的 F1 分數直接反饋模型表現。

      這一步的意義在于,隱私識別最難的往往不是顯而易見的手機號或郵箱,而是邊界模糊、依賴上下文的細粒度信息。

      比如一句「我最近壓力很大」是否需要脫敏?

      一句「我的血壓今天 160/110」又該被劃到什么級別?

      某個字符串到底是普通 ID,還是內部憑證?

      GRPO 讓模型在這些模糊邊界上進一步優化召回率與精確率的平衡,最終帶來了 MemPrivacy 在多個測試集上的明顯優勢。



      結語

      端云 Agent 的下一塊基礎設施

      在萬物皆可 Agent 的未來,大模型比你更懂你自己是必然趨勢,但比你更懂你,不代表讓云端看光你。

      OpenAI privacy-filter 的發布敲響了數據清洗和隱私合規的發令槍;而記憶張量與榮耀 AI 聯合發布的 MemPrivacy,則為下一代云邊協同架構(Edge-Cloud Agents)提供了一套直接可用、高精度、低損耗的標桿級工程解法。無論是對于開發個人 AI 助理的 AI Builders,還是對于需要滿足嚴苛數據合規(如 GDPR)的企業級出海應用,MemPrivacy 都展現出了不可估量的商業與技術價值。

      在這件事上,榮耀并不是一個偶然出現的合作方。從 MagicOS 到 YOYO,榮耀一直在嘗試把更多 AI 能力真正放進設備本身。這也是為什么 MemPrivacy 的方案會和榮耀的端側 AI 路線天然契合。

      MemPrivacy 在榮耀終端設備上的落地,則是這次合作的進一步延伸:0.6B 到 4B 的多檔模型本身就是為端側部署設計的。當越來越多人開始習慣通過 YOYO 這樣的 Agent 完成健康、出行、工作甚至財務相關的任務時,用戶真正需要的,其實是一個 “既懂你、又不會看光你” 的 AI。

      對端云 Agent 來說,“可記憶” 之后,“可安全記憶” 正在成為下一階段真正的基礎設施問題。

      目前,MemPrivacy 的模型權重與評測基準已全部開源。隱私與長期記憶之間那道過去幾乎無法兼得的墻,也第一次開始出現了被打通的可能。

      • 論文地址:https://arxiv.org/pdf/2605.09530
      • 代碼倉庫:https://github.com/MemTensor/MemPrivacy
      • 模型倉庫:https://huggingface.co/collections/IAAR-Shanghai/memprivacy

      特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。

      Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

      相關推薦
      熱點推薦
      “不漏一戶、不落一人”!廣西自治區主席視頻連線調度地震現場情況,督導抗震救災工作

      “不漏一戶、不落一人”!廣西自治區主席視頻連線調度地震現場情況,督導抗震救災工作

      極目新聞
      2026-05-19 12:41:42
      炸了!0票!東契奇!NBA瘋了

      炸了!0票!東契奇!NBA瘋了

      林子說事
      2026-05-19 03:42:02
      親姐妹明算賬? 李冰冰被曝與妹妹冷戰3個月, 坦言來生絕不一起工作

      親姐妹明算賬? 李冰冰被曝與妹妹冷戰3個月, 坦言來生絕不一起工作

      科學發掘
      2026-05-19 13:41:56
      749局處理哀牢山巨蟒事件

      749局處理哀牢山巨蟒事件

      有態度網友19w246
      2026-05-19 07:10:45
      48歲檢察官勾結警局局長,奸辱20多名女性,殺數十人包括國家干部

      48歲檢察官勾結警局局長,奸辱20多名女性,殺數十人包括國家干部

      莫地方
      2026-05-18 01:00:03
      中紀委發文,檢查組深入醫院

      中紀委發文,檢查組深入醫院

      梅斯醫學
      2026-05-19 07:54:09
      全線跳水!超15萬人爆倉!霍爾木茲海峽,大消息

      全線跳水!超15萬人爆倉!霍爾木茲海峽,大消息

      數據寶
      2026-05-17 07:59:37
      2015年,抗日名將杜聿明魂歸故里,女兒杜致廉站在墓前的罕見留影

      2015年,抗日名將杜聿明魂歸故里,女兒杜致廉站在墓前的罕見留影

      大運河時空
      2026-05-18 13:00:03
      斯洛伐克總理菲佐回懟德國總理默茨:我去不去莫斯科,關他什么事?還有幾個國家拒絕開放領空,令人震驚!

      斯洛伐克總理菲佐回懟德國總理默茨:我去不去莫斯科,關他什么事?還有幾個國家拒絕開放領空,令人震驚!

      極目新聞
      2026-05-18 09:49:50
      彈劾失敗,50萬人大罷工!小馬科斯為何突然對華示好?

      彈劾失敗,50萬人大罷工!小馬科斯為何突然對華示好?

      愛史紀
      2026-05-19 00:00:04
      狀態下滑?樊振東歐冠兩次遭零封,韓瑩老公:小胖過的肯定不太好

      狀態下滑?樊振東歐冠兩次遭零封,韓瑩老公:小胖過的肯定不太好

      郝小小看體育
      2026-05-18 23:32:21
      偷拍女生裙底研究生被擬錄用為公務員?江蘇省稅務局:顧某某還未被錄用,有關問題均已收到,正在處理

      偷拍女生裙底研究生被擬錄用為公務員?江蘇省稅務局:顧某某還未被錄用,有關問題均已收到,正在處理

      都市快報橙柿互動
      2026-05-18 20:44:46
      馬英九發通告力挺金溥聰,連戰方面說出真相,蕭旭岑或安然無恙!

      馬英九發通告力挺金溥聰,連戰方面說出真相,蕭旭岑或安然無恙!

      奇思妙想生活家
      2026-05-19 13:13:38
      太炸了!李冰冰戛納紅毯封神,53歲水墨高定禮服驚艷老外

      太炸了!李冰冰戛納紅毯封神,53歲水墨高定禮服驚艷老外

      調侃國際觀點
      2026-05-16 19:42:22
      恭喜廣東男籃!朱芳雨選拔人才,1人或被解約,杜鋒樂在其中

      恭喜廣東男籃!朱芳雨選拔人才,1人或被解約,杜鋒樂在其中

      鍋鍋愛歷史
      2026-05-19 00:13:28
      兩任國防部長判死緩,今天不得不提這個人了。

      兩任國防部長判死緩,今天不得不提這個人了。

      華人星光
      2026-05-08 11:04:21
      越鬧越大!盲道“擺拍”惹眾怒,B站百大UP主火速劃清界限

      越鬧越大!盲道“擺拍”惹眾怒,B站百大UP主火速劃清界限

      雷科技
      2026-05-18 16:18:54
      電商平臺廣為銷售的“日本叮叮”為商標,和日本無關

      電商平臺廣為銷售的“日本叮叮”為商標,和日本無關

      第一財經資訊
      2026-05-18 23:05:40
      內維爾:這個時候傳出瓜迪奧拉離任我很震驚,曼城全隊會很失望

      內維爾:這個時候傳出瓜迪奧拉離任我很震驚,曼城全隊會很失望

      懂球帝
      2026-05-19 10:14:26
      好消息!高齡津貼6月底全省統一升級,老人不用跑腿申請

      好消息!高齡津貼6月底全省統一升級,老人不用跑腿申請

      李博世財經
      2026-05-19 11:29:29
      2026-05-19 15:44:49
      機器之心Pro incentive-icons
      機器之心Pro
      專業的人工智能媒體
      13032文章數 142651關注度
      往期回顧 全部

      科技要聞

      馬斯克敗訴,法院判他起訴OpenAI太晚了

      頭條要聞

      賴清德"偷渡式"竄訪非洲國家被中國"踢出群" 大使發聲

      頭條要聞

      賴清德"偷渡式"竄訪非洲國家被中國"踢出群" 大使發聲

      體育要聞

      文班亞馬1比0雷霆:凌駕MVP的史詩價值

      娛樂要聞

      姚晨刪博難平眾怒,為什么她還能蹦噠

      財經要聞

      從賣流量到賣Token,運營商算力生意破局

      汽車要聞

      德味操控+聰明大腦,與眾07不輸新勢力

      態度原創

      藝術
      家居
      房產
      旅游
      健康

      藝術要聞

      蔣萬安手寫賀卡成焦點!網友:字軟人弱!練書法3年,該如何提高

      家居要聞

      觀山隱秀 心靈沉淀

      房產要聞

      7516元/㎡,161套一次全甩!海口住宅最低價出現了!

      旅游要聞

      棗莊:碧水青山相映趣 靈芝湖畔好風光

      專家揭秘干細胞回輸的安全風險

      無障礙瀏覽 進入關懷版 主站蜘蛛池模板: 日本高清www片久久| 国产精品白浆在线观看免费| 黑人无码av| 亚洲中久无码永久在线观看软件 | 中文人妻无码专区| 乱伦导航| 好吊视频一区二区三区人妖| 依依成人精品视频在线观看| 黄色一区二区三区在线| 国产精品福利自产拍在线观看 | 九九热精品在线观看| 曾医生17分钟??下载| 国产午夜福利不卡在线观看| 狠狠躁18三区二区一区| 91性爱| 国产嫩草精品网亚洲av| 妺妺窝人体色www聚色窝仙踪| 国产成人午夜福利高清在线观看 | 免费精品一区二区三区第35| 日本免费视频| 尤物yw193无码点击进入| 国产91色在线观看| 亚洲天堂AVav| 国产jlzzjlzz视频免费看| 无码国产精品一区二区VR老人| 91福利国产午夜亚洲精品| 国产精品麻豆欧美日韩ww| 国产亚洲欧美日韩精品一区二区| 亚洲成人一区二区AV在线| 2020国产激情视频在线观看| 人妻无码ΑV中文字幕久久琪琪布| 久久婷婷五月综合色精品| 成人区人妻精品一区二蜜臀| 日韩无码毛片| 精品亚洲麻豆1区2区3区| 在线观看 av香蕉| 国产精品网址在线观看你懂的| 精品国精品自拍自在线| 亚洲爆乳少妇无码激情| 67194欧洲| 色欲二区|