您当前的位置:首页 > 世界杯积分榜 > 正文

世界杯压球官网 越懂你,越危境?MemPrivacy揭示AI系念下一站

来源:未知   作者:admin   时间:2026-05-21 20:28   浏览:186

世界杯压球官网 越懂你,越危境?MemPrivacy揭示AI系念下一站

图片

机器之心发布

AI 系念期间 ,Agent 越来越像一个信得过的私东说念主助理。

它难忘你的风尚,知说念你的日程,强壮你的健康状态,以至能在遥远对话中缓慢形成一套对于你的「个东说念主画像」。但问题也随之而来:如若这些系念都要上云,心事还安全吗?

4 月 22 日,OpenAI 开源了一个名为 privacy-filter 的轻量级心事过滤模子,试图处分大模子系统中的 PII 检测与脱敏问题。

OpenAI Privacy Filter 地址:https://openai.com/zh-Hans-CN/index/introducing-openai-privacy-filter/

只是两周后,系念张量 MemTensor 团队拿出了一个更激进的谜底。该决策由系念张量 MemTensor 与荣耀 HONOR 团队趋附研发,同济大学也参与其中 —— 这亦然端侧厂商与系念基础设施团队初次在「Agent 心事」这件事上深度合营。

他们看重开源了面向端云协同 Agent 的心事保护框架与系列模子 MemPrivacy。更令东说念主无意的是,在相似的简直对话心事提真金不怕火任务上,MemPrivacy 的 F1 分数最高比 OpenAI privacy-filter 进步 50.47 %。

这并不是一次临时跨界。

在此之前,系念张量一经推出 MemOS,把 Agent 系念从向量库或 RAG 插件,进步为可管制、可窜改、可演化的系统资源:记什么、奈何检索、怎么更新、怎么治理,都被放进一套「系念操作系统」里。

MemPrivacy 更像是 MemOS 往端云协同场景当然长出的心事层 —— 当 Agent 驱动遥远记着用户偏好、健康状态、账号阐发和职责凹凸文时,问题就不单是「能弗成记着」,而是「能弗成安全地记着」。这也让系念张量作念 MemPrivacy 显得严容庄容:它不是从通用 PII 打码启程,而是平直从 Agent 遥远系念的简直使用场景启程,重新界说心事类型、保护级别和占位符机制。

发布本日,MemPrivacy 即上榜 Hugging Face Daily&Weekly Papers TOP1。

这不是一个粗放的「心事打码器具」。

它对准的是下一代个性化 Agent 最中枢、也最辣手的问题:怎么让云表大模子延续领有遥远系念和个性化智力,同期又不让用户的敏锐数据信得过离开腹地?

换句话说,MemPrivacy 想作念的事情是:让 Agent 可用,但不可见。

论文标题:MemPrivacy: Privacy-Preserving Personalized Memory Management for Edge-Cloud Agents

OpenAI 入局

2026世界杯中国最新押注app

但 8 个标签撑不起 Agent 的遥远系念

OpenAI 的 privacy-filter 想路很粗放:扫描文本,识别心事片断,然后替换谚语义标签。

比如,把用户输入中的东说念主名「Maya」替换成 [PRIVATE_PERSON]。

这套模子领有 1.5B 参数,其中激活参数约 50M,接管双向 Token 分类架构,提拔 128k 凹凸文,主打高朦拢量 PII 检测与掩码。

比拟传长入律替换成 *** 的打码形貌,这虽然一经进了一步:它至少保留了一部分语义。

但放到端云 Agent 的遥远系念场景里,问题很快暴自满来了。

OpenAI privacy-filter 只提供 8 类基础心事标签。对于平常表单脱敏,这也许够用;但对于一个需设施悟用户、遥远系念用户、以至调用器具替用户践诺任务的 Agent 来说,这个粒度太粗了。

银行卡号、社保编号、技俩档案号,可能都会被塞进归拢个 [ACCOUNT_NUMBER]。登录密码、数据库阐发、API Key、里面密钥,也可能全都变成 [SECRET]。

这就像把通盘危境物品都贴上「危境」两个字。

安全是安全了少量,但语义也被抹平了。

信得过的问题在于,Agent 不是数据库清洗剧本。它需设施悟凹凸文、保留关系、形成系念,并在未来的对话中延续使用这些信息。

当用户说「我的血压今天是 160/110」时,这不是平常数字,而是健康野心;当用户说「这是我公司数据库的畅达串」时,这也不是平常文本,而是高危阐发。粗粒度标签一朝识别不到,就会漏;一朝识别错,就会撤废语义。

于是,心事过滤投入了一个两难模式:

漏判,用户心事裸奔;误判,Agent 飞速失忆。

这恰是下一代个性化 Agent 最难绕开的矛盾。

MemPrivacy 登场

不是抹掉心事,而是给心事换一张「腹地身份证」

系念张量 MemTensor 团队提议的 MemPrivacy,中枢想路叫作念:腹地可逆伪匿名化。

它不是把心事信息粗放删除,也不是替换成无意旨的星号,而是在端侧完成一次更考究的「偷梁换柱」。

通盘这个词经由不错拆成三步。

第一步,端侧上行脱敏。

用户在手机、PC 等边际建设上与 Agent 对话时,腹地会先运行一个轻量级 MemPrivacy 模子。它负责识别对话中的心事片断,并根据用户建树的保护等第进行处理。

如若文本里出现「我的血压今天是 160/110」,MemPrivacy 不会平直把它变成 ***,而是替换为近似 这么的细粒度类型化占位符。

简直血压值与占位符之间的映射关系,只保存在腹地数据库里。

第二步,云表安全处理。

云表大模子看到的是:「我的血压今天是 。」

它看不到 160/110 这个明文敏锐数据,但依然知说念这里是一个健康野心,因此不错延续进行推理、生成建议、形成系念,以至调用相关器具。

第三步,端侧下行规复。

当云表复兴「您的血压 偏高」时,腹地系统再把占位符规复成简直数值,最终呈现给用户。

在用户体验上,这个过程险些是透明的。

但在系统架构上,要道敏锐数据从未信得过离开腹地。

这即是 MemPrivacy 最进军的联想:让云表看懂结构,但看不到明文。

三种阶梯对比

无保护裸奔,全过滤失忆,MemPrivacy 保留才略

在端云 Agent 场景里,传统心事保护好像有两种顶点决策。

第一种是无保护。

用户原始数据平直上云。云表模子虽然不错完满强壮凹凸文,个性化后果最佳,但健康数据、私东说念主邮箱、家庭住址、账号阐发等敏锐信息也会完满流露。

在数据合规越来越严格的今天,这险些是在走钢丝。

第二种是完全过滤。

通盘心事内容都被替换成 *** 或平直删除。看起来很安全,但代价是 Agent 透顶失去要道语义。用户想让它记着健康情景、财务敛迹、职责凹凸文,2026世界杯-最新版官方软件它却只可看到一派空缺。

这类 Agent 看似安全,现实上一经丧失了「遥远个性化」的基础。

MemPrivacy 聘用的是第三条路:细粒度类型化占位符。

云表不知说念你的简直血压是几许,但知说念这是一个健康野心;不知说念你的私东说念主邮箱是什么,但知说念这里有一个邮箱;不知说念你的 API Key 明文,但知说念这里是一个高危阐发。

这种联想保住了两个东西:一是心事范围,二是语义结构。

也正因如斯,MemPrivacy 才有契机在心事保护和 Agent 效力之间获得均衡。

硬核实力

F1 分数甩开 OpenAI 超 50 点,完爆 GPT-5.2

为了考证 MemPrivacy 的智力,有计划团队构建了一个新的评测基准 MemPrivacy-Bench。这个基准笼罩 200 个用户的对话历史,包含零碎 15.5 万个心事项,并提拔中英双语心事信息检测。

此外,为了测试泛化智力,团队还在外部个性化长文本对话数据集 PersonaMem-v2 上进行了 OOD 交叉测试。

在这两大基准的提真金不怕火准确率(心事文本、级别、类型的详细 F1 分数)较量中,MemPrivacy 均展现出了碾压级的上风:

远超 OpenAI 专项模子:

在 MemPrivacy-Bench 上,OpenAI privacy-filter 的详细 F1 分数惟有 35.50%。

而 MemPrivacy-4B-RL 达到了 85.97%,两者差距高达惊东说念主的 50.47%!即使是在跨散布的 PersonaMem-v2 数据集上,MemPrivacy 依然来源 OpenAI 近 9%。

原因也很了了:OpenAI privacy-filter 的上风在速率,非自追溯 Token 分类架构带来了很高朦拢量;但它的问题在于标签笼罩窄、颗粒度粗,对复杂凹凸文和汉文场景的适配不及。

MemPrivacy 则针对 Agent 长系念场景重新界说了心事类型、保护级别和考验方向,因此在简直对话中更接近现实需求。

更专诚想的是,MemPrivacy 不单是赢了 OpenAI 的专项小模子。

越级挑战通用大模子:

即使靠近参数目极其渊博的最强通用模子 GPT-5.2、Gemini-3.1-Pro 以及 DeepSeek-V3.2-Think,MemPrivacy-4B 乃至仅有 0.6B 的小型版块在两个数据集上均达成了碾压。

这讲明,心事提真金不怕火不是粗放堆大参数就能处分的问题。

它更像一个高度结构化、强敛迹、强范围感的任务。信得过进军的不是模子有多大,而是它是否强壮「什么信息该被保护、该保护到什么进度、保护后还能弗成延续被 Agent 使用」。

不让 Agent 变傻

系统效力亏蚀最低不到 1%

心事保护还有一个更现实的问题:保护得再好,如若 Agent 变傻了,亦然徒劳。

这亦然好多强横脱敏决策的死穴。

用户说:「我最近血压偏高,帮我记着,以后安排畅通诡计时看重少量。」

如若系统把血压、健康状态、畅通偏好一皆抹掉,云表模子虽然安全了,但它也没法再提供信得过个性化的处事。

MemPrivacy 的类型化占位符真的能保留系念系统的效力吗?

团队在业界几个主流系念系统平台上进行了端到端测试。通盘底座均接管长入的 GPT-4.1 模子。

实验驱逐令东说念主粗犷:

当接管传统的不可逆掩码(Irreversible Masking)时,三大系念系统的准确率分离暴跌了 26.67%、41.87% 和 16.99%,模子险些处于失忆的瘫痪状态。

而在 MemPrivacy 保护下(最高审视级别 PL4+PL3+PL2 全开),系统效力亏蚀被死死纵容在 0.71% ~ 1.60% 之间。如若用户仅聘用保护最高风险的阐发级心事(PL4),准确率着落以至不到 0.89%。

这意味着,MemPrivacy 信得过作念到了在不伤害智能体才略的前提下,把心事泄漏风险降到了最低。

这恰是 MemPrivacy 的要道价值:它不是在「安全」和「智能」之间二选一,而是试图把两者隔绝 —— 明文不上云,但语义仍然可用。

四级心事树

终于把「什么是心事」讲了了了

MemPrivacy 能作念到这少量,背后一个进军原因是:它莫得把心事手脚一个粗放的二分类问题。

传统心事过滤时常是「要么脱敏,要么全明文」。但简直寰宇远比这复杂。

MemPrivacy 引入了以可识别性、潜在危害性与可运用性为准绳的四级心事分类法 (PL1-PL4),从而提拔用户根据需求摆脱调控脱敏阈值:

PL4 致命中枢级(最高劝诫阐发与好意思妙)

这一层包括明文密码、考证码、Session、Cookie、API Key、里面交易好意思妙等。一朝清楚,就可能导致账户袭取、资金盗刷、系统越权或大限制数据清楚。

这类数据一朝检测到,系统将实行 “绝对零容忍” 遏抑,严禁投入云表凹凸文。

PL3 高危敏锐级(激发人命财产风险的红线数据)

包括身份证件号、详备医疗会诊、生理野心、精确轨迹定位、生物特征、敏锐消耗纪录等。它们不一定平直等于账号权限,但足以对东说念主身安全、财产、健康和声誉变成本色伤害。

PL2 身份锚定级(可溯源的绚烂信息)

包括简直姓名、详备地址、手机号、私东说念主邮箱、IP 地址、酬酢账号等。单独或组合起来,不错定位到具体当然东说念主。尤其是「公司 + 职位 + 姓名」这类组合,在简直场景中也具备很强的可识别性。

PL1 基础画像级(安全可用的个性化基石)

包括作息风尚、好奇偏好、非会诊性神气、抒发格调等。这类信息是个性化 Agent 的基础,一般不会带来本色伤害,因此不错安全用于遥远系念。

这套分层联想的意旨在于 —— 它让心事保护不再是一把锤子。

相似是消耗纪录,「在超市花了 86 块钱」可能只是日常偏好;但某笔带有明确医疗属性的消耗,则可能投入 PL3。

相似是数字,有些只是平常计数,有些却是血压、身份证号、考证码或 API Key。

这即是细粒度心事识别信得过清贫的地点:模子必须强壮语义、凹凸文、风险和用途。

两阶段考验

让模子信得过强壮心事范围

在模子考验上,MemPrivacy 接管了 Qwen3 系列作为基座,笼罩 0.6B、1.7B、4B 多个规格。

考验过程分为两个阶段。

第一阶段是 SFT。

团队使用 26K 高质料多轮对话数据进行监督微调,让模子掌执基础的心事定位、类型识别和占位符替换智力。

第二阶段是 GRPO 强化学习。

团队引入基于结构化 Reward 的政策优化,用提真金不怕火驱逐的 F1 分数平直反映模子发达。

这一步的意旨在于,心事识别最难的时常不是不言而喻的手机号或邮箱,而是范围暗昧、依赖凹凸文的细粒度信息。

比如一句「我最近压力很大」是否需要脱敏?

一句「我的血压今天 160/110」又该被划到什么级别?

某个字符串到底是平常 ID,如故里面阐发?

GRPO 让模子在这些暗昧范围上进一步优化调回率与精确率的均衡,最终带来了 MemPrivacy 在多个测试集上的昭着上风。

结语

端云 Agent 的下一块基础设施

在万物皆可 Agent 的未来,大模子比你更懂你我方是势必趋势,但比你更懂你,不代表让云表看光你。

OpenAI privacy-filter 的发布敲响了数据清洗和心事合规的发令枪;而系念张量与荣耀 AI 结伴髻布的 MemPrivacy,则为下一代云边协同架构(Edge-Cloud Agents)提供了一套平直可用、高精度、低损耗的标杆级工程解法。不管是对于征战个东说念主 AI 助理的 AI Builders,如故对于需要得志严苛数据合规(如 GDPR)的企业级出海应用,MemPrivacy 都展现出了不可量度的交易与时间价值。

在这件事上,荣耀并不是一个惟恐出现的合营方。从 MagicOS 到 YOYO,荣耀一直在尝试把更多 AI 智力信得过放进建设自己。这亦然为什么 MemPrivacy 的决策会和荣耀的端侧 AI 阶梯自然契合。

MemPrivacy 在荣耀结尾建设上的落地,则是此次合营的进一步延迟:0.6B 到 4B 的多档模子自己即是为端侧部署联想的。当越来越多东说念主驱动风尚通过 YOYO 这么的 Agent 完成健康、出行、职责以至财务相关的任务时,用户信得过需要的,其实是一个 “既懂你、又不会看光你” 的 AI。

对端云 Agent 来说,“可系念” 之后,“可安全系念” 正在成为下一阶段信得过的基础设施问题。

当今世界杯压球官网,MemPrivacy 的模子权重与评测基准已一皆开源。心事与遥远系念之间那说念昔日险些无法兼得的墙,也第一次驱动出现了被买通的可能。