关闭广告

台大与中研院突破:新型防御技术实现AI深度内容遗忘

科技行者1702人阅读


这项由台湾大学和中研院信息技术创新研究中心联合开展的突破性研究发表于2025年12月,研究团队针对当前AI画图模型的安全漏洞提出了创新解决方案。感兴趣的读者可以通过论文编号arXiv:2512.22877v1查询完整研究内容。

现在的AI画图工具就像一位技艺精湛但记忆混乱的画家。你可以通过特殊训练让它"忘记"如何画某些敏感内容,比如武器或版权角色。然而,这种"失忆"其实很脆弱。当有人换个方式提要求时,这位AI画家往往会突然"想起来",重新画出那些本该被禁止的内容。

研究团队发现了一个惊人的现象:虽然现有的"概念擦除"技术在面对直接文字指令时表现良好,但当用户使用更巧妙的方法时,这些防护就形同虚设。具体来说,用户可以通过两种方式绕过防护:一是使用从图片中学习得到的特殊"密码",二是直接把想要复制的图片转换成AI能理解的"草图",然后让AI重新画一遍。

为了彻底解决这个问题,研究团队开发了一套全新的评估体系,叫做M-ErasureBench,同时还推出了一个叫做IRECE的防御插件。这个插件的工作原理就像一个精明的审查员,能在AI作画过程中实时监控,一旦发现画面中出现违禁

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

莱因克尔:对阵勒沃库森时哈弗茨应首发,他能提供更多东西

懂球帝 浏览 559

40岁邓莎宣布离婚!直言无法改变路行,将告别过去追求新的人生

萌神木木 浏览 1642

"1999年小朋友捐140元给国家造航母"热传 当事人发声

都市快报橙柿互动 浏览 6838

北溪爆炸案一嫌犯身份曝光 案发时为乌军现役士兵

财联社 浏览 1987

曼奇尼自曝若阿莫林下课其可执教曼联!失业一年,在法国遇到拉爵

罗米的曼联博客 浏览 2800

高质量孵化器里有了“机器人驾校”

文汇报 浏览 2476

Anthropic指控DeepSeek等中国AI大模型抄袭 遭马斯克贴脸开骂:贼喊捉贼 大规模窃秘数据

快科技 浏览 956

营收147亿的半导体资产遭冻结 闻泰科技:坚决反对

21世纪经济报道 浏览 2835

新年强势开局!AI需求叠加供给趋紧,存储芯片迎来集体反弹

华尔街见闻官方 浏览 1795

美媒:美对伊朗行动选项"远超传统空袭"

新华社 浏览 1633

央视发文悼念老戏骨许绍雄,原来这才是真实的他

娱乐圈笔娱君 浏览 2621

英伟达CEO黄仁勋:“上帝级AI”还很遥远,但世界仍需向前发展

IT之家 浏览 1692

寒武纪业绩“惊雷”:环比数据全线下滑,却意外点燃AI行情!

君临财富 浏览 2593

采用插混动力 奇瑞风云A7谍照曝光

车质网 浏览 569

北京降雪来袭 多家超市保供稳价进行时

中国商报 浏览 1736

MSC咨询合伙人金霞:可持续发展+AI,重构商业增长范式

南方都市报 浏览 2577

欧文:拜仁现在肯定懊悔不已,赫拉芬贝赫身价绝对超过1亿镑

直播吧 浏览 3479

被欠钱球迷去世5天后 前国脚戴琳还清欠款多给了5000

封面新闻 浏览 12961

千问App宣布投入30亿元启动春节活动,2月6日上线

大象新闻 浏览 1458

伊姐十一热推:电影《阿凡达:水之道》;电影《毕正明的证明》......

伊周潮流 浏览 2447

丹麦羽毛球公开赛今日打响,石宇奇迎来世锦赛后首次亮相

懂球帝 浏览 2894
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1