关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者1707人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

2025年,他们集齐了十二枚臂章

我们的太空 浏览 1495

冲刺双重上市,潮宏基还有多少隐忧待解

铑财 浏览 2332

更年轻化 新款丰田卡罗拉将于12月21日上市

车质网 浏览 2056

窦骁何超莲国外被偶遇!女方冲浪心情大好,窦骁喝咖啡满脸愁容

萌神木木 浏览 2512

E句话| 白姐从不爆假料?

仙女事件簿 浏览 2600

大型文化纪实纪录片《因为长江》定档10月27日

安徽博物院 浏览 2767

长安汽车10月销量27.8万辆 同比增长11%

网易汽车 浏览 2326

智能体系统如何「边做边学」?斯坦福团队探索在线优化的新范式

机器之心Pro 浏览 2711

拿地即亮相!首钢·璟瑞长安择址长安街,解锁京西人居新篇

365财经plus 浏览 1413

最火的赛道,独角兽撑不下去了?

中国新闻周刊 浏览 1928

读懂IPO|奥特蛋真有暴利?金添动漫靠情绪价值年入近9亿元,正由经销批发走向零售店

时代周报 浏览 2590

恰20:今天我们运气不错,我们要努力达到我们应得的位置

懂球帝 浏览 2550

陈道明主演!36集谍战剧来袭,是《沉默的荣耀》后我唯一想追的剧

娱乐圈笔娱君 浏览 2764

经典之上再造经典 BJ40探险家上市 13.49万元起

网易汽车 浏览 1647

伊媒发布小学被炸瞬间 战斧导弹从天而降

潇湘晨报 浏览 633

赖清德声称打造所谓"台湾之盾"防空系统 国台办回应

界面新闻 浏览 2892

2026款奥迪Q6上市!售46.76万起 车长5099mm比Q7还大

念寒车评 浏览 1681

好美啊!58岁的她开挂了

黎贝卡的异想世界 浏览 1770

对话黑芝麻高管:不烧钱造新芯,机器人平台发布前已经创收

车东西 浏览 2307

世卫组织发话:美国有权退出 2.6亿美元欠费必须交上

极目新闻 浏览 5695

6岁女童练习"下腰"致截瘫 经营者曾因逃避执行被刑拘

红星新闻 浏览 16441
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1