关闭广告

苏州大学突破:8B模型实现长文理解媲美GPT-4o

科技行者2524人阅读


当我们阅读一本厚厚的小说时,大脑会自动筛选重要情节,忽略无关细节。然而,人工智能在处理长文本时却常常"迷失在细节中",就像一个初读者被海量信息淹没,难以抓住关键要点。现在,苏州大学的研究团队找到了解决这个问题的巧妙方法,他们提出的"语境降噪训练"技术,让AI模型学会了像经验丰富的读者一样,在冗长文本中精准定位关键信息。

这项由苏州大学唐泽成、季百倍、李俊涛等研究人员主导的突破性研究,于2025年1月发表在机器学习顶级预印本平台arXiv上(论文编号:arXiv:2510.05862v1)。令人振奋的是,通过他们的训练方法,一个仅有80亿参数的开源模型在处理长文本任务时,竟然达到了与GPT-4o相当的表现水平。这就好比一个刚入学的学生,通过特殊的学习方法,在阅读理解能力上追平了博士生。

长文本处理一直是AI领域的"老大难"问题。传统的语言模型在面对超长文档时,往往会被无关信息干扰,就像在嘈杂的派对上试图听清某个特定的对话一样困难。研究团队发现,这些模型虽然能"看到"整篇文档,却无法有效区分哪些内容真正重要,哪些只是"噪音"。

为了解决这个问题,研究人员开发了一种名为"语

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

魅族Flyme Auto新增生态用户数在11月首次突破20万

IT之家 浏览 2115

50万往上的车,还用1.5T增程器,车企穷疯了?左右逃不出3个原因

小李车评李建红 浏览 1811

巴基斯坦和阿富汗同意继续停火 将于11月继续会谈

环球网资讯 浏览 2557

副院长传出不雅视频后赴外地坐诊引争议 当地医院删文

红星新闻 浏览 12969

年代犯罪剧又出王炸!才播3集热度第一,张家辉演技惊艳四座

娱乐圈笔娱君 浏览 3373

曝娜扎被抢休息室,刘亦菲聊天监听,后台大瓜!

萌神木木 浏览 2362

直播电商迈步“全链条监管”

北京商报 浏览 1809

未来四川舰、福建舰如何打配合 专家解读

环球网资讯 浏览 2374

Nature|尺寸与光电转换效率创世界纪录,上海科学家团队携手龙头企业突破大尺寸钙钛矿光伏模组产业化关键技术

上观新闻 浏览 2879

体图:格纳布里愿意接受较低薪资,拜仁可能和他续约两年

懂球帝 浏览 2684

以专家:以色列唯一正确选择 就是100%服从特朗普安排

中国新闻周刊 浏览 10830

场均14.3分!马拉加球员卡利诺斯基当选本届洲际杯MVP!

直播吧 浏览 2972

实用|| 百元外套穿出万元既视感,这个思路太妙了!

黎贝卡的异想世界 浏览 2027

球员是否因阿森纳输球更有动力?瓜帅:我建议他们专注于自己

懂球帝 浏览 1543

马斯克摊上事了,旗下公司被多国调查封禁

21世纪经济报道 浏览 1797

沈伯洋被指到处寻求"保护" 邱毅:"台独"分子们都慌了

环球网资讯 浏览 8090

知名网红"小黑妮"官宣怀孕:以后打算再生1个随我姓

鲁中晨报 浏览 7851

相恋6年"军官女友"收60余万后消失 警方证实其已落网

红星新闻 浏览 19635

特朗普:美对委军事计划"泄密者"已被抓

扬子晚报 浏览 1620

谷歌翻译加入文本翻译AI模型,有快速与进阶模式可选

IT之家 浏览 2647

海昌智能IPO:“母子”共同“闯关”,重大关联交易或成拦路虎

览富财经网 浏览 1624
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1