世界杯压球官网越懂你，越危境？MemPrivacy揭示AI系念下一站

来源：未知作者：admin 时间：2026-05-21 20:28 浏览：186

机器之心发布

AI 系念期间，Agent 越来越像一个信得过的私东说念主助理。

它难忘你的风尚，知说念你的日程，强壮你的健康状态，以至能在遥远对话中缓慢形成一套对于你的「个东说念主画像」。但问题也随之而来：如若这些系念都要上云，心事还安全吗？

4 月 22 日，OpenAI 开源了一个名为 privacy-ﬁlter 的轻量级心事过滤模子，试图处分大模子系统中的 PII 检测与脱敏问题。

OpenAI Privacy Filter 地址：https://openai.com/zh-Hans-CN/index/introducing-openai-privacy-filter/

只是两周后，系念张量 MemTensor 团队拿出了一个更激进的谜底。该决策由系念张量 MemTensor 与荣耀 HONOR 团队趋附研发，同济大学也参与其中 —— 这亦然端侧厂商与系念基础设施团队初次在「Agent 心事」这件事上深度合营。

他们看重开源了面向端云协同 Agent 的心事保护框架与系列模子 MemPrivacy。更令东说念主无意的是，在相似的简直对话心事提真金不怕火任务上，MemPrivacy 的 F1 分数最高比 OpenAI privacy-filter 进步 50.47 %。

这并不是一次临时跨界。

在此之前，系念张量一经推出 MemOS，把 Agent 系念从向量库或 RAG 插件，进步为可管制、可窜改、可演化的系统资源：记什么、奈何检索、怎么更新、怎么治理，都被放进一套「系念操作系统」里。

MemPrivacy 更像是 MemOS 往端云协同场景当然长出的心事层 —— 当 Agent 驱动遥远记着用户偏好、健康状态、账号阐发和职责凹凸文时，问题就不单是「能弗成记着」，而是「能弗成安全地记着」。这也让系念张量作念 MemPrivacy 显得严容庄容：它不是从通用 PII 打码启程，而是平直从 Agent 遥远系念的简直使用场景启程，重新界说心事类型、保护级别和占位符机制。

发布本日，MemPrivacy 即上榜 Hugging Face Daily&Weekly Papers TOP1。

这不是一个粗放的「心事打码器具」。

它对准的是下一代个性化 Agent 最中枢、也最辣手的问题：怎么让云表大模子延续领有遥远系念和个性化智力，同期又不让用户的敏锐数据信得过离开腹地？

换句话说，MemPrivacy 想作念的事情是：让 Agent 可用，但不可见。

论文标题：MemPrivacy: Privacy-Preserving Personalized Memory Management for Edge-Cloud Agents

OpenAI 入局

2026世界杯中国最新押注app

但 8 个标签撑不起 Agent 的遥远系念

OpenAI 的 privacy-filter 想路很粗放：扫描文本，识别心事片断，然后替换谚语义标签。

比如，把用户输入中的东说念主名「Maya」替换成 [PRIVATE_PERSON]。

这套模子领有 1.5B 参数，其中激活参数约 50M，接管双向 Token 分类架构，提拔 128k 凹凸文，主打高朦拢量 PII 检测与掩码。

比拟传长入律替换成 *** 的打码形貌，这虽然一经进了一步：它至少保留了一部分语义。

但放到端云 Agent 的遥远系念场景里，问题很快暴自满来了。

OpenAI privacy-filter 只提供 8 类基础心事标签。对于平常表单脱敏，这也许够用；但对于一个需设施悟用户、遥远系念用户、以至调用器具替用户践诺任务的 Agent 来说，这个粒度太粗了。

银行卡号、社保编号、技俩档案号，可能都会被塞进归拢个 [ACCOUNT_NUMBER]。登录密码、数据库阐发、API Key、里面密钥，也可能全都变成 [SECRET]。

这就像把通盘危境物品都贴上「危境」两个字。

安全是安全了少量，但语义也被抹平了。

信得过的问题在于，Agent 不是数据库清洗剧本。它需设施悟凹凸文、保留关系、形成系念，并在未来的对话中延续使用这些信息。

当用户说「我的血压今天是 160/110」时，这不是平常数字，而是健康野心；当用户说「这是我公司数据库的畅达串」时，这也不是平常文本，而是高危阐发。粗粒度标签一朝识别不到，就会漏；一朝识别错，就会撤废语义。

于是，心事过滤投入了一个两难模式：

漏判，用户心事裸奔；误判，Agent 飞速失忆。

这恰是下一代个性化 Agent 最难绕开的矛盾。

MemPrivacy 登场

不是抹掉心事，而是给心事换一张「腹地身份证」

系念张量 MemTensor 团队提议的 MemPrivacy，中枢想路叫作念：腹地可逆伪匿名化。

它不是把心事信息粗放删除，也不是替换成无意旨的星号，而是在端侧完成一次更考究的「偷梁换柱」。

通盘这个词经由不错拆成三步。

第一步，端侧上行脱敏。

用户在手机、PC 等边际建设上与 Agent 对话时，腹地会先运行一个轻量级 MemPrivacy 模子。它负责识别对话中的心事片断，并根据用户建树的保护等第进行处理。

如若文本里出现「我的血压今天是 160/110」，MemPrivacy 不会平直把它变成 ***，而是替换为近似这么的细粒度类型化占位符。

简直血压值与占位符之间的映射关系，只保存在腹地数据库里。

第二步，云表安全处理。

云表大模子看到的是：「我的血压今天是。」

它看不到 160/110 这个明文敏锐数据，但依然知说念这里是一个健康野心，因此不错延续进行推理、生成建议、形成系念，以至调用相关器具。

第三步，端侧下行规复。

当云表复兴「您的血压偏高」时，腹地系统再把占位符规复成简直数值，最终呈现给用户。

在用户体验上，这个过程险些是透明的。

但在系统架构上，要道敏锐数据从未信得过离开腹地。

这即是 MemPrivacy 最进军的联想：让云表看懂结构，但看不到明文。

三种阶梯对比

无保护裸奔，全过滤失忆，MemPrivacy 保留才略

在端云 Agent 场景里，传统心事保护好像有两种顶点决策。

第一种是无保护。

用户原始数据平直上云。云表模子虽然不错完满强壮凹凸文，个性化后果最佳，但健康数据、私东说念主邮箱、家庭住址、账号阐发等敏锐信息也会完满流露。

在数据合规越来越严格的今天，这险些是在走钢丝。

第二种是完全过滤。

通盘心事内容都被替换成 *** 或平直删除。看起来很安全，但代价是 Agent 透顶失去要道语义。用户想让它记着健康情景、财务敛迹、职责凹凸文，2026世界杯-最新版官方软件它却只可看到一派空缺。

这类 Agent 看似安全，现实上一经丧失了「遥远个性化」的基础。

MemPrivacy 聘用的是第三条路：细粒度类型化占位符。

云表不知说念你的简直血压是几许，但知说念这是一个健康野心；不知说念你的私东说念主邮箱是什么，但知说念这里有一个邮箱；不知说念你的 API Key 明文，但知说念这里是一个高危阐发。

这种联想保住了两个东西：一是心事范围，二是语义结构。

也正因如斯，MemPrivacy 才有契机在心事保护和 Agent 效力之间获得均衡。

硬核实力

F1 分数甩开 OpenAI 超 50 点，完爆 GPT-5.2

为了考证 MemPrivacy 的智力，有计划团队构建了一个新的评测基准 MemPrivacy-Bench。这个基准笼罩 200 个用户的对话历史，包含零碎 15.5 万个心事项，并提拔中英双语心事信息检测。

此外，为了测试泛化智力，团队还在外部个性化长文本对话数据集 PersonaMem-v2 上进行了 OOD 交叉测试。

在这两大基准的提真金不怕火准确率（心事文本、级别、类型的详细 F1 分数）较量中，MemPrivacy 均展现出了碾压级的上风：

远超 OpenAI 专项模子：

在 MemPrivacy-Bench 上，OpenAI privacy-filter 的详细 F1 分数惟有 35.50%。

而 MemPrivacy-4B-RL 达到了 85.97%，两者差距高达惊东说念主的 50.47%！即使是在跨散布的 PersonaMem-v2 数据集上，MemPrivacy 依然来源 OpenAI 近 9%。

原因也很了了：OpenAI privacy-filter 的上风在速率，非自追溯 Token 分类架构带来了很高朦拢量；但它的问题在于标签笼罩窄、颗粒度粗，对复杂凹凸文和汉文场景的适配不及。

MemPrivacy 则针对 Agent 长系念场景重新界说了心事类型、保护级别和考验方向，因此在简直对话中更接近现实需求。

更专诚想的是，MemPrivacy 不单是赢了 OpenAI 的专项小模子。

越级挑战通用大模子：

即使靠近参数目极其渊博的最强通用模子 GPT-5.2、Gemini-3.1-Pro 以及 DeepSeek-V3.2-Think，MemPrivacy-4B 乃至仅有 0.6B 的小型版块在两个数据集上均达成了碾压。

这讲明，心事提真金不怕火不是粗放堆大参数就能处分的问题。

它更像一个高度结构化、强敛迹、强范围感的任务。信得过进军的不是模子有多大，而是它是否强壮「什么信息该被保护、该保护到什么进度、保护后还能弗成延续被 Agent 使用」。

不让 Agent 变傻

系统效力亏蚀最低不到 1%

心事保护还有一个更现实的问题：保护得再好，如若 Agent 变傻了，亦然徒劳。

这亦然好多强横脱敏决策的死穴。

用户说：「我最近血压偏高，帮我记着，以后安排畅通诡计时看重少量。」

如若系统把血压、健康状态、畅通偏好一皆抹掉，云表模子虽然安全了，但它也没法再提供信得过个性化的处事。

MemPrivacy 的类型化占位符真的能保留系念系统的效力吗？

团队在业界几个主流系念系统平台上进行了端到端测试。通盘底座均接管长入的 GPT-4.1 模子。

实验驱逐令东说念主粗犷：

当接管传统的不可逆掩码（Irreversible Masking）时，三大系念系统的准确率分离暴跌了 26.67%、41.87% 和 16.99%，模子险些处于失忆的瘫痪状态。

而在 MemPrivacy 保护下（最高审视级别 PL4+PL3+PL2 全开），系统效力亏蚀被死死纵容在 0.71% ~ 1.60% 之间。如若用户仅聘用保护最高风险的阐发级心事（PL4），准确率着落以至不到 0.89%。

这意味着，MemPrivacy 信得过作念到了在不伤害智能体才略的前提下，把心事泄漏风险降到了最低。

这恰是 MemPrivacy 的要道价值：它不是在「安全」和「智能」之间二选一，而是试图把两者隔绝 —— 明文不上云，但语义仍然可用。

四级心事树

终于把「什么是心事」讲了了了

MemPrivacy 能作念到这少量，背后一个进军原因是：它莫得把心事手脚一个粗放的二分类问题。

传统心事过滤时常是「要么脱敏，要么全明文」。但简直寰宇远比这复杂。

MemPrivacy 引入了以可识别性、潜在危害性与可运用性为准绳的四级心事分类法 (PL1-PL4)，从而提拔用户根据需求摆脱调控脱敏阈值：

PL4 致命中枢级（最高劝诫阐发与好意思妙）

这一层包括明文密码、考证码、Session、Cookie、API Key、里面交易好意思妙等。一朝清楚，就可能导致账户袭取、资金盗刷、系统越权或大限制数据清楚。

这类数据一朝检测到，系统将实行 “绝对零容忍” 遏抑，严禁投入云表凹凸文。

PL3 高危敏锐级（激发人命财产风险的红线数据）

包括身份证件号、详备医疗会诊、生理野心、精确轨迹定位、生物特征、敏锐消耗纪录等。它们不一定平直等于账号权限，但足以对东说念主身安全、财产、健康和声誉变成本色伤害。

PL2 身份锚定级（可溯源的绚烂信息）

包括简直姓名、详备地址、手机号、私东说念主邮箱、IP 地址、酬酢账号等。单独或组合起来，不错定位到具体当然东说念主。尤其是「公司 + 职位 + 姓名」这类组合，在简直场景中也具备很强的可识别性。

PL1 基础画像级（安全可用的个性化基石）

包括作息风尚、好奇偏好、非会诊性神气、抒发格调等。这类信息是个性化 Agent 的基础，一般不会带来本色伤害，因此不错安全用于遥远系念。

这套分层联想的意旨在于 —— 它让心事保护不再是一把锤子。

相似是消耗纪录，「在超市花了 86 块钱」可能只是日常偏好；但某笔带有明确医疗属性的消耗，则可能投入 PL3。

相似是数字，有些只是平常计数，有些却是血压、身份证号、考证码或 API Key。

这即是细粒度心事识别信得过清贫的地点：模子必须强壮语义、凹凸文、风险和用途。

两阶段考验

让模子信得过强壮心事范围

在模子考验上，MemPrivacy 接管了 Qwen3 系列作为基座，笼罩 0.6B、1.7B、4B 多个规格。

考验过程分为两个阶段。

第一阶段是 SFT。

团队使用 26K 高质料多轮对话数据进行监督微调，让模子掌执基础的心事定位、类型识别和占位符替换智力。

第二阶段是 GRPO 强化学习。

团队引入基于结构化 Reward 的政策优化，用提真金不怕火驱逐的 F1 分数平直反映模子发达。

这一步的意旨在于，心事识别最难的时常不是不言而喻的手机号或邮箱，而是范围暗昧、依赖凹凸文的细粒度信息。

比如一句「我最近压力很大」是否需要脱敏？

一句「我的血压今天 160/110」又该被划到什么级别？

某个字符串到底是平常 ID，如故里面阐发？

GRPO 让模子在这些暗昧范围上进一步优化调回率与精确率的均衡，最终带来了 MemPrivacy 在多个测试集上的昭着上风。

结语

端云 Agent 的下一块基础设施

在万物皆可 Agent 的未来，大模子比你更懂你我方是势必趋势，但比你更懂你，不代表让云表看光你。

OpenAI privacy-filter 的发布敲响了数据清洗和心事合规的发令枪；而系念张量与荣耀 AI 结伴髻布的 MemPrivacy，则为下一代云边协同架构（Edge-Cloud Agents）提供了一套平直可用、高精度、低损耗的标杆级工程解法。不管是对于征战个东说念主 AI 助理的 AI Builders，如故对于需要得志严苛数据合规（如 GDPR）的企业级出海应用，MemPrivacy 都展现出了不可量度的交易与时间价值。

在这件事上，荣耀并不是一个惟恐出现的合营方。从 MagicOS 到 YOYO，荣耀一直在尝试把更多 AI 智力信得过放进建设自己。这亦然为什么 MemPrivacy 的决策会和荣耀的端侧 AI 阶梯自然契合。

MemPrivacy 在荣耀结尾建设上的落地，则是此次合营的进一步延迟：0.6B 到 4B 的多档模子自己即是为端侧部署联想的。当越来越多东说念主驱动风尚通过 YOYO 这么的 Agent 完成健康、出行、职责以至财务相关的任务时，用户信得过需要的，其实是一个 “既懂你、又不会看光你” 的 AI。

对端云 Agent 来说，“可系念” 之后，“可安全系念” 正在成为下一阶段信得过的基础设施问题。

当今世界杯压球官网，MemPrivacy 的模子权重与评测基准已一皆开源。心事与遥远系念之间那说念昔日险些无法兼得的墙，也第一次驱动出现了被买通的可能。

世界杯压球官网 越懂你，越危境？MemPrivacy揭示AI系念下一站

世界杯压球官网越懂你，越危境？MemPrivacy揭示AI系念下一站