世界杯压球官网 越懂你,越危境?MemPrivacy揭示AI系念下一站


机器之心发布
AI 系念期间 ,Agent 越来越像一个信得过的私东说念主助理。
它难忘你的风尚,知说念你的日程,强壮你的健康状态,以至能在遥远对话中缓慢形成一套对于你的「个东说念主画像」。但问题也随之而来:如若这些系念都要上云,心事还安全吗?
4 月 22 日,OpenAI 开源了一个名为 privacy-filter 的轻量级心事过滤模子,试图处分大模子系统中的 PII 检测与脱敏问题。

OpenAI Privacy Filter 地址:https://openai.com/zh-Hans-CN/index/introducing-openai-privacy-filter/
只是两周后,系念张量 MemTensor 团队拿出了一个更激进的谜底。该决策由系念张量 MemTensor 与荣耀 HONOR 团队趋附研发,同济大学也参与其中 —— 这亦然端侧厂商与系念基础设施团队初次在「Agent 心事」这件事上深度合营。
他们看重开源了面向端云协同 Agent 的心事保护框架与系列模子 MemPrivacy。更令东说念主无意的是,在相似的简直对话心事提真金不怕火任务上,MemPrivacy 的 F1 分数最高比 OpenAI privacy-filter 进步 50.47 %。
这并不是一次临时跨界。
在此之前,系念张量一经推出 MemOS,把 Agent 系念从向量库或 RAG 插件,进步为可管制、可窜改、可演化的系统资源:记什么、奈何检索、怎么更新、怎么治理,都被放进一套「系念操作系统」里。
MemPrivacy 更像是 MemOS 往端云协同场景当然长出的心事层 —— 当 Agent 驱动遥远记着用户偏好、健康状态、账号阐发和职责凹凸文时,问题就不单是「能弗成记着」,而是「能弗成安全地记着」。这也让系念张量作念 MemPrivacy 显得严容庄容:它不是从通用 PII 打码启程,而是平直从 Agent 遥远系念的简直使用场景启程,重新界说心事类型、保护级别和占位符机制。


发布本日,MemPrivacy 即上榜 Hugging Face Daily&Weekly Papers TOP1。
这不是一个粗放的「心事打码器具」。
它对准的是下一代个性化 Agent 最中枢、也最辣手的问题:怎么让云表大模子延续领有遥远系念和个性化智力,同期又不让用户的敏锐数据信得过离开腹地?
换句话说,MemPrivacy 想作念的事情是:让 Agent 可用,但不可见。

论文标题:MemPrivacy: Privacy-Preserving Personalized Memory Management for Edge-Cloud Agents
OpenAI 入局
2026世界杯中国最新押注app但 8 个标签撑不起 Agent 的遥远系念
OpenAI 的 privacy-filter 想路很粗放:扫描文本,识别心事片断,然后替换谚语义标签。
比如,把用户输入中的东说念主名「Maya」替换成 [PRIVATE_PERSON]。
这套模子领有 1.5B 参数,其中激活参数约 50M,接管双向 Token 分类架构,提拔 128k 凹凸文,主打高朦拢量 PII 检测与掩码。
比拟传长入律替换成 *** 的打码形貌,这虽然一经进了一步:它至少保留了一部分语义。
但放到端云 Agent 的遥远系念场景里,问题很快暴自满来了。
OpenAI privacy-filter 只提供 8 类基础心事标签。对于平常表单脱敏,这也许够用;但对于一个需设施悟用户、遥远系念用户、以至调用器具替用户践诺任务的 Agent 来说,这个粒度太粗了。
银行卡号、社保编号、技俩档案号,可能都会被塞进归拢个 [ACCOUNT_NUMBER]。登录密码、数据库阐发、API Key、里面密钥,也可能全都变成 [SECRET]。
这就像把通盘危境物品都贴上「危境」两个字。
安全是安全了少量,但语义也被抹平了。
信得过的问题在于,Agent 不是数据库清洗剧本。它需设施悟凹凸文、保留关系、形成系念,并在未来的对话中延续使用这些信息。
当用户说「我的血压今天是 160/110」时,这不是平常数字,而是健康野心;当用户说「这是我公司数据库的畅达串」时,这也不是平常文本,而是高危阐发。粗粒度标签一朝识别不到,就会漏;一朝识别错,就会撤废语义。
于是,心事过滤投入了一个两难模式:
漏判,用户心事裸奔;误判,Agent 飞速失忆。
这恰是下一代个性化 Agent 最难绕开的矛盾。
MemPrivacy 登场
不是抹掉心事,而是给心事换一张「腹地身份证」
系念张量 MemTensor 团队提议的 MemPrivacy,中枢想路叫作念:腹地可逆伪匿名化。
它不是把心事信息粗放删除,也不是替换成无意旨的星号,而是在端侧完成一次更考究的「偷梁换柱」。

通盘这个词经由不错拆成三步。
第一步,端侧上行脱敏。
用户在手机、PC 等边际建设上与 Agent 对话时,腹地会先运行一个轻量级 MemPrivacy 模子。它负责识别对话中的心事片断,并根据用户建树的保护等第进行处理。
如若文本里出现「我的血压今天是 160/110」,MemPrivacy 不会平直把它变成 ***,而是替换为近似 这么的细粒度类型化占位符。
简直血压值与占位符之间的映射关系,只保存在腹地数据库里。
第二步,云表安全处理。
云表大模子看到的是:「我的血压今天是 。」
它看不到 160/110 这个明文敏锐数据,但依然知说念这里是一个健康野心,因此不错延续进行推理、生成建议、形成系念,以至调用相关器具。
第三步,端侧下行规复。
当云表复兴「您的血压 偏高」时,腹地系统再把占位符规复成简直数值,最终呈现给用户。
在用户体验上,这个过程险些是透明的。
但在系统架构上,要道敏锐数据从未信得过离开腹地。
这即是 MemPrivacy 最进军的联想:让云表看懂结构,但看不到明文。
三种阶梯对比
无保护裸奔,全过滤失忆,MemPrivacy 保留才略
在端云 Agent 场景里,传统心事保护好像有两种顶点决策。
第一种是无保护。
用户原始数据平直上云。云表模子虽然不错完满强壮凹凸文,个性化后果最佳,但健康数据、私东说念主邮箱、家庭住址、账号阐发等敏锐信息也会完满流露。
在数据合规越来越严格的今天,这险些是在走钢丝。
第二种是完全过滤。
通盘心事内容都被替换成 *** 或平直删除。看起来很安全,但代价是 Agent 透顶失去要道语义。用户想让它记着健康情景、财务敛迹、职责凹凸文,2026世界杯-最新版官方软件它却只可看到一派空缺。
这类 Agent 看似安全,现实上一经丧失了「遥远个性化」的基础。

MemPrivacy 聘用的是第三条路:细粒度类型化占位符。
云表不知说念你的简直血压是几许,但知说念这是一个健康野心;不知说念你的私东说念主邮箱是什么,但知说念这里有一个邮箱;不知说念你的 API Key 明文,但知说念这里是一个高危阐发。
这种联想保住了两个东西:一是心事范围,二是语义结构。
也正因如斯,MemPrivacy 才有契机在心事保护和 Agent 效力之间获得均衡。
硬核实力
F1 分数甩开 OpenAI 超 50 点,完爆 GPT-5.2
为了考证 MemPrivacy 的智力,有计划团队构建了一个新的评测基准 MemPrivacy-Bench。这个基准笼罩 200 个用户的对话历史,包含零碎 15.5 万个心事项,并提拔中英双语心事信息检测。
此外,为了测试泛化智力,团队还在外部个性化长文本对话数据集 PersonaMem-v2 上进行了 OOD 交叉测试。
在这两大基准的提真金不怕火准确率(心事文本、级别、类型的详细 F1 分数)较量中,MemPrivacy 均展现出了碾压级的上风:

远超 OpenAI 专项模子:
在 MemPrivacy-Bench 上,OpenAI privacy-filter 的详细 F1 分数惟有 35.50%。
而 MemPrivacy-4B-RL 达到了 85.97%,两者差距高达惊东说念主的 50.47%!即使是在跨散布的 PersonaMem-v2 数据集上,MemPrivacy 依然来源 OpenAI 近 9%。
原因也很了了:OpenAI privacy-filter 的上风在速率,非自追溯 Token 分类架构带来了很高朦拢量;但它的问题在于标签笼罩窄、颗粒度粗,对复杂凹凸文和汉文场景的适配不及。
MemPrivacy 则针对 Agent 长系念场景重新界说了心事类型、保护级别和考验方向,因此在简直对话中更接近现实需求。
更专诚想的是,MemPrivacy 不单是赢了 OpenAI 的专项小模子。
越级挑战通用大模子:
即使靠近参数目极其渊博的最强通用模子 GPT-5.2、Gemini-3.1-Pro 以及 DeepSeek-V3.2-Think,MemPrivacy-4B 乃至仅有 0.6B 的小型版块在两个数据集上均达成了碾压。
这讲明,心事提真金不怕火不是粗放堆大参数就能处分的问题。
它更像一个高度结构化、强敛迹、强范围感的任务。信得过进军的不是模子有多大,而是它是否强壮「什么信息该被保护、该保护到什么进度、保护后还能弗成延续被 Agent 使用」。
不让 Agent 变傻
系统效力亏蚀最低不到 1%
心事保护还有一个更现实的问题:保护得再好,如若 Agent 变傻了,亦然徒劳。
这亦然好多强横脱敏决策的死穴。
用户说:「我最近血压偏高,帮我记着,以后安排畅通诡计时看重少量。」
如若系统把血压、健康状态、畅通偏好一皆抹掉,云表模子虽然安全了,但它也没法再提供信得过个性化的处事。
MemPrivacy 的类型化占位符真的能保留系念系统的效力吗?
团队在业界几个主流系念系统平台上进行了端到端测试。通盘底座均接管长入的 GPT-4.1 模子。

实验驱逐令东说念主粗犷:
当接管传统的不可逆掩码(Irreversible Masking)时,三大系念系统的准确率分离暴跌了 26.67%、41.87% 和 16.99%,模子险些处于失忆的瘫痪状态。
而在 MemPrivacy 保护下(最高审视级别 PL4+PL3+PL2 全开),系统效力亏蚀被死死纵容在 0.71% ~ 1.60% 之间。如若用户仅聘用保护最高风险的阐发级心事(PL4),准确率着落以至不到 0.89%。
这意味着,MemPrivacy 信得过作念到了在不伤害智能体才略的前提下,把心事泄漏风险降到了最低。
这恰是 MemPrivacy 的要道价值:它不是在「安全」和「智能」之间二选一,而是试图把两者隔绝 —— 明文不上云,但语义仍然可用。
四级心事树
终于把「什么是心事」讲了了了
MemPrivacy 能作念到这少量,背后一个进军原因是:它莫得把心事手脚一个粗放的二分类问题。
传统心事过滤时常是「要么脱敏,要么全明文」。但简直寰宇远比这复杂。
MemPrivacy 引入了以可识别性、潜在危害性与可运用性为准绳的四级心事分类法 (PL1-PL4),从而提拔用户根据需求摆脱调控脱敏阈值:

PL4 致命中枢级(最高劝诫阐发与好意思妙)
这一层包括明文密码、考证码、Session、Cookie、API Key、里面交易好意思妙等。一朝清楚,就可能导致账户袭取、资金盗刷、系统越权或大限制数据清楚。
这类数据一朝检测到,系统将实行 “绝对零容忍” 遏抑,严禁投入云表凹凸文。
PL3 高危敏锐级(激发人命财产风险的红线数据)
包括身份证件号、详备医疗会诊、生理野心、精确轨迹定位、生物特征、敏锐消耗纪录等。它们不一定平直等于账号权限,但足以对东说念主身安全、财产、健康和声誉变成本色伤害。
PL2 身份锚定级(可溯源的绚烂信息)
包括简直姓名、详备地址、手机号、私东说念主邮箱、IP 地址、酬酢账号等。单独或组合起来,不错定位到具体当然东说念主。尤其是「公司 + 职位 + 姓名」这类组合,在简直场景中也具备很强的可识别性。
PL1 基础画像级(安全可用的个性化基石)
包括作息风尚、好奇偏好、非会诊性神气、抒发格调等。这类信息是个性化 Agent 的基础,一般不会带来本色伤害,因此不错安全用于遥远系念。
这套分层联想的意旨在于 —— 它让心事保护不再是一把锤子。
相似是消耗纪录,「在超市花了 86 块钱」可能只是日常偏好;但某笔带有明确医疗属性的消耗,则可能投入 PL3。
相似是数字,有些只是平常计数,有些却是血压、身份证号、考证码或 API Key。
这即是细粒度心事识别信得过清贫的地点:模子必须强壮语义、凹凸文、风险和用途。
两阶段考验
让模子信得过强壮心事范围
在模子考验上,MemPrivacy 接管了 Qwen3 系列作为基座,笼罩 0.6B、1.7B、4B 多个规格。
考验过程分为两个阶段。
第一阶段是 SFT。
团队使用 26K 高质料多轮对话数据进行监督微调,让模子掌执基础的心事定位、类型识别和占位符替换智力。
第二阶段是 GRPO 强化学习。
团队引入基于结构化 Reward 的政策优化,用提真金不怕火驱逐的 F1 分数平直反映模子发达。
这一步的意旨在于,心事识别最难的时常不是不言而喻的手机号或邮箱,而是范围暗昧、依赖凹凸文的细粒度信息。
比如一句「我最近压力很大」是否需要脱敏?
一句「我的血压今天 160/110」又该被划到什么级别?
某个字符串到底是平常 ID,如故里面阐发?
GRPO 让模子在这些暗昧范围上进一步优化调回率与精确率的均衡,最终带来了 MemPrivacy 在多个测试集上的昭着上风。

结语
端云 Agent 的下一块基础设施
在万物皆可 Agent 的未来,大模子比你更懂你我方是势必趋势,但比你更懂你,不代表让云表看光你。
OpenAI privacy-filter 的发布敲响了数据清洗和心事合规的发令枪;而系念张量与荣耀 AI 结伴髻布的 MemPrivacy,则为下一代云边协同架构(Edge-Cloud Agents)提供了一套平直可用、高精度、低损耗的标杆级工程解法。不管是对于征战个东说念主 AI 助理的 AI Builders,如故对于需要得志严苛数据合规(如 GDPR)的企业级出海应用,MemPrivacy 都展现出了不可量度的交易与时间价值。
在这件事上,荣耀并不是一个惟恐出现的合营方。从 MagicOS 到 YOYO,荣耀一直在尝试把更多 AI 智力信得过放进建设自己。这亦然为什么 MemPrivacy 的决策会和荣耀的端侧 AI 阶梯自然契合。
MemPrivacy 在荣耀结尾建设上的落地,则是此次合营的进一步延迟:0.6B 到 4B 的多档模子自己即是为端侧部署联想的。当越来越多东说念主驱动风尚通过 YOYO 这么的 Agent 完成健康、出行、职责以至财务相关的任务时,用户信得过需要的,其实是一个 “既懂你、又不会看光你” 的 AI。
对端云 Agent 来说,“可系念” 之后,“可安全系念” 正在成为下一阶段信得过的基础设施问题。
当今世界杯压球官网,MemPrivacy 的模子权重与评测基准已一皆开源。心事与遥远系念之间那说念昔日险些无法兼得的墙,也第一次驱动出现了被买通的可能。