关闭广告

AI大模型"减肥"新突破:MWS AI团队让语言模型变小却更聪明

科技行者878人阅读


这项由MWS AI公司和ITMO大学联合完成的研究发表于2025年10月,论文编号为arXiv:2509.22075v2。研究团队包括来自MWS AI的Dmitriy Shopkhoev、Denis Makhov、Magauiya Zhussip和Stamatios Lefkimmiatis,以及来自ITMO大学的Ammar Ali。有兴趣深入了解的读者可以通过该论文编号查询完整研究报告。

现在的大型语言模型就像一台超级智能的机器,能够回答各种问题、写文章、翻译语言,但有一个大问题:它们实在太"胖"了。这些模型需要占用大量的计算机内存和处理能力,就像一辆装满行李的重型卡车,虽然功能强大,但开起来费油又缓慢。对于想在手机、平板电脑或者小型服务器上运行这些智能助手的人来说,这简直是个噩梦。

为了解决这个问题,研究人员们想出了各种"减肥"方法。最流行的一种方法叫做"低秩分解",可以把它理解为把一个复杂的大拼图拆解成几个简单的小拼图。但是这种方法有个致命缺陷:它假设所有的拼图碎片都必须遵循同一个模式,就像强制要求所有人都穿同一个尺码的衣服一样,结果往往是不合身的。

MWS A

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

联合国官员:加沙惨状如末日电影

上观新闻 浏览 802

五六十岁“穿衣见品味”!这4个搭配小技巧,比同龄人显气质

静儿时尚达人 浏览 2013

媒体:尹锡悦被邢海明大使理性发言激怒 下场发声

北京日报客户端-长安街知事 浏览 16146

网红用特警训练做背景蹭流量,被训诫并道歉

趣看热点 浏览 25387

小米推出“围观短剧”App:主打“无广告海量短剧免费看”

IT之家 浏览 1020

女星安吉丽娜·朱莉访乌 其随身保镖被乌军征兵处抓走服役

极目新闻 浏览 667

2024年,合资品牌还有一战之力

百姓评车 浏览 12359

多家美媒密集放风:布林肯将在几周内访华,期待恢复中美高层沟通

环球网资讯 浏览 16451

涉嫌严重违纪违法 70后博士市长辞职半年后官宣落马

上观新闻 浏览 92632

朱珠带娃看画展 1岁女儿帮拎4万元包包

娱絮 浏览 15696

全尺寸货运版eVTOL样机已总装下线,「蓝霄航空」完成新一轮数千万元融资,年内累计融资近亿元|36氪首发

36氪 浏览 987

遭天风证券"并表"终止后 恒泰证券财富管理中层"组团"离职

界面新闻 浏览 12497

郑智化吐槽大陆机场,评论区沦陷

娱乐圈笔娱君 浏览 785

媒体:日本或让美F-35战机带核炸弹部署 以"威慑中国"

枢密院十号 浏览 40991

胡润榜财富增长较快的雷军李书福,每分钟净赚37万和15万?

BT财经 浏览 647

冰箱:莫雷一直纵容哈登不做脏活累活 现在前者终于自食其果了

直播吧 浏览 14505

旅拍这赛道,还得看倪妮

时尚COSMO 浏览 851

熊园:“十五五”大方向已定,如何跟踪?

首席经济学家论坛 浏览 820

美国提议土耳其向乌提供S-400 土方拒绝:侵犯土主权

枢密院十号 浏览 112230

媒体:普京公开露面对瓦格纳事件作了一个重要定性

直新闻 浏览 15581

达达“曝家丑”,京东受伤

雷达财经 浏览 12616
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1