关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者2809人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

香港65公斤黄金被劫价值超半亿 西九龙重案组深夜通报

极目新闻 浏览 15067

特朗普:目前不打算供乌“战斧”导弹

央视新闻客户端 浏览 2706

多名男女当街爬行学狗叫 官方:企业团建行为已致歉

极目新闻 浏览 9173

“棕色大衣”今年冬天又火了,怎么搭都高级时髦

LinkFashion 浏览 1991

《唐诡3》将至,苏无名卢凌风兄弟反目,8大诡案一个比一个瘆得慌

最爱酷影视 浏览 3527

等折叠屏iPhone要再熬两年?郭明錤称恐缺货至2027年

环球网资讯 浏览 2010

2026纽约秋冬时装周,在春天开启美的新故事!

LinkFashion 浏览 1061

巴平民被枪杀 特朗普扬言“冲进加沙铲除哈马斯”

参考消息 浏览 8736

道指重挫800点,IBM跌超13%,白银期货涨超7%,加密货币超16万人爆仓

21世纪经济报道 浏览 993

桑乔替补登场又被换下,埃梅里:这不是惩罚,而是战术决定

懂球帝 浏览 2592

这俩人原来是夫妻,因拍《红楼梦》结缘

素衣读史 浏览 1954

鲁媒:洛佩斯需证明自己,否则很可能不在泰山队未来计划中

懂球帝 浏览 2856

港女最爱的国产单品,赢了特斯拉?

新周刊 浏览 2293

TOP TOY,成不了泡泡玛特?

斑马消费 浏览 3402

科技感爆棚 大众ID. ERA 9X内饰官图发布

车质网 浏览 904

乌克兰袭击莫斯科一座热电站 距克宫仅百余公里

上观新闻 浏览 2362

猛龙109-97逆转老鹰,英格拉姆20分,巴雷特19+5+4

懂球帝 浏览 2422

计划3年完成200个AI项目 川影联动人工智能协会打造“AI影视工业梦工厂”

封面新闻 浏览 2921

曹操出行Robotaxi 2.0已搭载低轨卫星通信,将上线卫星SOS功能

IT之家 浏览 1476

QClaw指令发红包?微信员工紧急回应:假的!

雷科技 浏览 782

小米汽车超级工厂供应商,斯坦德机器人赴港IPO|港E声

时代周报 浏览 1759
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1