关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者2583人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro 浏览 1706

李亚鹏与哥哥和解 只有一条真心话短信

温柔娱公子 浏览 940

独行侠内线再多也不够?浓眉小腿拉伤至少缺阵两场

体坛周报 浏览 2616

活塞13连胜追平队史纪录!揭秘东部黑马再次蜕变:冲击队史第4冠

罗说NBA 浏览 2295

图片报:格雷罗恢复训练并有机会出战霍村,莱默尔尚未参加

懂球帝 浏览 1433

杭州女子洗完澡一抬头 发现窗外停着一架无人机

极目新闻 浏览 2838

让多图对话AI不再"搞混":首尔多所大学发现分隔符背后的秘密

科技行者 浏览 1426

车导的瓜没吃完 孟桐的瓜又来了 那英如何反击?

动物奇奇怪怪 浏览 3396

Unity 中国官宣与零跑汽车合作,打造下一代智能座舱交互体验

IT之家 浏览 2594

闪充加持 新款方程豹豹8申报信息曝光

车质网 浏览 648

第二十七届高交会将于下周举办,中国太空游项目将全球首发

南方都市报 浏览 2551

沉默的荣耀大结局前瞻,最惨角色出炉,果然不幸的人各有各的不幸

娱乐圈笔娱君 浏览 2853

沉默的荣耀众星发文告别,吴越真挚,余皑磊搞笑,于和伟看哭众人

娱乐圈笔娱君 浏览 2732

60+女性穿搭指南来了:4招告别“大妈感”,解锁冬日优雅气质

静儿时尚达人 浏览 1751

冬天,“大衣”是中年女人的穿搭刚需,这样搭配时髦提气质

静儿时尚达人 浏览 1905

比亚迪成为全球首家达成1400万辆里程碑的新能源车企

财闻 浏览 2838

规模扩大、体验升级 2025“我与地坛”北京书市亮点纷呈

中国商报 浏览 3517

鸿蒙智行的上限,该重新评估了

汽车公社 浏览 2140

二手车商称雷军在吹牛:现在有的车型降10万都没人要

都市现场 浏览 7061

272马力四驱 全新一汽奥迪Q5L高功率实车曝光

网易汽车 浏览 2790

曝古二家人被骚扰!90多岁外婆被人找上门,难怪放录音重锤王家卫

萌神木木 浏览 2564
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1