关闭广告

让大模型“瘦身”90%!清华&哈工大提出极限压缩方案

量子位12386人阅读

徐玉庄 投稿
量子位 | 公众号 QbitAI

对大模型进行量化、剪枝等压缩操作,是部署时最常见不过的一环了。

不过,这个极限究竟有多大?

清华大学和哈工大的一项联合研究给出的答案是:

90%。

他们提出了大模型1bit极限压缩框架OneBit,首次实现大模型权重压缩超越90%并保留大部分(83%)能力。

可以说,玩儿的就是“既要也要”~



一起来看看。

大模型1bit量化方法来了

从剪枝、量化,到知识蒸馏、权重低秩分解,大模型已经可以实现压缩四分之一权重而几乎无损。

权重

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

辽宁省委书记、省长会见来华的俄罗斯外宾 有重要背景

政知新媒体 浏览 79595

马朝旭:台湾问题是中美关系中最具爆炸性的问题

环球网资讯 浏览 11076

贾玲减了100斤!袁弘3次编辑微博疑质疑,网友斥其卖惨营销惹争议

缘木不求娱 浏览 12649

央视一套40集大剧今晚播出,请来高伟光陈数,收视又要爆了

肥罗大电影 浏览 12170

持续对抗缠斗 南昌舰直面外军真实经历

环球网 浏览 12802

德法西战机围着中国飞圈,收紧遏华“绞索”

浏览 10611

夏天 果然是属于碎花裙的!

欧洲王室八卦 浏览 15000

5战全胜!文班亚马17+12+4帽马刺29分大胜步行者 7人上双制胜

醉卧浮生 浏览 960

对话余承东:华为没必要下场造车 不做20万以下的车

网易科技报道 浏览 19134

国安2-4海牛历史首次主场输给对手,此前12战10胜2平仅失3球

懂球帝 浏览 777

抗日名将孙立人次子已正式向大陆申请 将父亲迁葬故里

环球时报新闻 浏览 12719

2024年了,最好看的还是这件毛衣!

LinkFashion 浏览 13427

测Manus 1.5:丝滑,超预期,Manus独特上下文工程的一次关键展示

硅星人 浏览 966

湾区晚会名场面:小沈阳和女儿同框,肖战台下合照,歌手真唱翻车

萌神木木 浏览 1418

法兰克福左后卫布朗:我们依靠整体防守萨拉赫,而不是我单防

懂球帝 浏览 875

火锅店女子劝阻领桌男子不要吸烟,当场被泼不明液体

趣看热点 浏览 1233504

机构抱团是A股特色?NO!美股抱团是常态

券商中国 浏览 26328

金曲奖:艾怡良颁错奖成史上最大乌龙

萌神木木 浏览 15526

印度各地发现240种变异新冠病毒,实际感染人数或已经超过3亿

趣看热点 浏览 125193

用友网络回应华为进军ERP致股价跌停:反应过度

界面新闻 浏览 18892

“十五五”提到的量子科技,商业化落地到哪一步了?

BT财经 浏览 700
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1