关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者858人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

一块“十全十美”饼干,盛满星辰大海的甜

我们的太空 浏览 713

宝马投资7亿美元改造慕尼黑工厂,2027年底开始专门生产纯电动车

网易科技报道 浏览 12437

以色列宣布对“费城走廊”实现“完全作战控制”

新华社 浏览 11109

殷世航快手账号被封禁,快手:平台接到用户23万条举报信

趣看热点 浏览 25942

驯服动力电池这头怪兽 | 血色2023

汽车公社 浏览 12947

泽连斯基:俄乌停火只会让俄方受益

财联社 浏览 12552

泽连斯基称俄罗斯正为更大规模冲突做准备 俄方回应

红星新闻 浏览 1468

一加 15 / Ace6“双舰齐发”,新机发布定档 10 月 17 日

IT之家 浏览 903

国家统计局:2023年全年GDP1260582亿,比上年增长5.2%

国家统计局 浏览 12783

林心如曝与霍建华婚姻裂隙:孕期独守空房

一盅情怀 浏览 950

晋朝是中国历史上最糟糕的朝代,司马炎到晋惠帝后期西晋维持37年

趣看热点 浏览 25967

被这位姐姐圈粉!5件单品3种搭配立刻年轻20岁

小陈聊搭配 浏览 15181

"中国神泥"驾到 180亿市值"吞下"千亿资产?

券商中国 浏览 26331

受好莱坞罢工影响 《沙丘2》推迟至明年上映

网易娱乐 浏览 15141

经纪公司否认玄彬孙艺珍离婚 怒斥假新闻过于离谱

网易娱乐 浏览 19826

俄三防部队司令遇袭身亡案调查结束 细节披露

每日经济新闻 浏览 1014

航行警告:渤海部分海域进行军事演习

央视军事 浏览 1662

台北一醉酒女被男子拖墙边性侵超10分钟 现场无人制止

都市快报橙柿互动 浏览 4923

"医生里面最会做官的"院长落马 案件更多细节披露

八点健闻 浏览 110703

穿真丝的女人 自带高级感

小西的穿搭日记 浏览 17131

甲流来袭,“比新冠疼多了”,奥司他韦一盒难求!

证券时报e公司 浏览 19130
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1