关闭广告

东南大学突破:AI学会情境化拒绝能力

科技行者2808人阅读


由东南大学计算机科学与工程学院的杨俊明、许宁、刘彪、乔世奇和耿新等研究者组成的团队,最近在人工智能领域取得了一项重要突破。这项研究发表于2025年,论文编号为arXiv:2509.23371v1,提出了一种名为MetaAPO(Meta-Weighted Adaptive Preference Optimization)的全新AI训练方法。有兴趣深入了解的读者可以通过该编号查询完整论文。

要理解这项研究的重要性,我们先来看一个生活中的例子。假设你正在教孩子学习做饭,你有两种教学资源:一套经典的家传菜谱(就像AI训练中的离线数据),还有让孩子实际动手练习的机会(就像在线生成的数据)。传统的AI训练方法就像只用家传菜谱或只让孩子盲目练习,而东南大学团队的新方法则像是配备了一位智慧的厨艺老师,这位老师能够根据孩子当前的水平,灵活决定什么时候该参考菜谱,什么时候该放手让孩子实践,从而让学习效果达到最佳。

当前的大型语言模型训练面临着一个根本性的挑战:如何让AI既能从人类已有的经验中学习,又能通过实践不断改进自己。这就像是在平衡传承与创新的关系。传统方法要么过度依赖预先收集的人类反馈数据,导致AI无法适应新情况;要么完全

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

徐正源:永不言弃是成都强大的DNA 韦世豪伤情要等明天才有结果

直播吧 浏览 3513

崔东树:2025年全国汽车市场总体走势较强 新能源商用车景气度走高

智通财经 浏览 2072

具俊晔暴瘦现身,搀扶着S妈,小S神情哀伤,范玮琪夫妻同行

素素娱乐 浏览 1437

今冬高质感穿搭,很有气质!

Yuki女人故事 浏览 2391

2026春夏十大流行色

LinkFashion 浏览 1493

真爱大牌返场|| 一上线就被抢空的牌子,这次居然100+就能拥有

黎贝卡的异想世界 浏览 2509

微创、高效、直达大脑!我国科学家开辟脑卒中病灶给药新路径

环球网资讯 浏览 1654

50+女性秋日别瞎打扮,这3招让你告别油腻感,优雅好气质

静儿时尚达人 浏览 2559

热力公司入户测温佩戴的记录仪上印着警徽 住户报警

大风新闻 浏览 31150

“超级周”来袭!美联储,降息稳了?

券商中国 浏览 2699

美军宣布再次打击"贩毒船" 致4人死亡

环球网资讯 浏览 2570

卧底记者给美容院"拉客" 顾客消费16190记者拿80%返利

鲁中晨报 浏览 8587

帮助截瘫患者重获运动功能,华山神外脑机接口团队在上海先进事迹报告会分享创新故事

上观新闻 浏览 2672

他被谢霆锋打成重伤,如今怎么样了?

卷史 浏览 2718

每体:拉菲尼亚伤势恢复不如预期,出战国家德比存疑

懂球帝 浏览 2836

澎湃读报丨央媒刊文追忆杨振宁先生:心系家国,功在世界

澎湃新闻 浏览 2647

红旗首款越野车征名送车

大象新闻 浏览 2806

在迎来更多国际承认之际 巴勒斯坦领土已"所剩无几"

参考消息 浏览 18926

召集全球高级将领开会前 美军试射4枚导弹

新民晚报 浏览 3331

管网检测、墙板安装……全国顶尖建筑机器人来渝亮“绝招”

上游新闻 浏览 2719

以军对加沙地带南部的哈马斯目标发动袭击

新华社 浏览 2743
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1