关闭广告

让大模型“瘦身”90%!清华&哈工大提出极限压缩方案

量子位12412人阅读

徐玉庄 投稿
量子位 | 公众号 QbitAI

对大模型进行量化、剪枝等压缩操作,是部署时最常见不过的一环了。

不过,这个极限究竟有多大?

清华大学和哈工大的一项联合研究给出的答案是:

90%。

他们提出了大模型1bit极限压缩框架OneBit,首次实现大模型权重压缩超越90%并保留大部分(83%)能力。

可以说,玩儿的就是“既要也要”~



一起来看看。

大模型1bit量化方法来了

从剪枝、量化,到知识蒸馏、权重低秩分解,大模型已经可以实现压缩四分之一权重而几乎无损。

权重

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

满脸雀斑也不妨碍她们当女神!

ChicMyGeek 浏览 19572

《画皮》剧组,周迅刚刚站起来,赵薇上去对着她的椅子就是一脚

趣看热点 浏览 26257

手机动辄2亿像素,照片会撑爆内存吗?

中新经纬 浏览 980

罗马诺:切尔西激活奥利斯3500万镑解约金,球员已同意加盟

直播吧 浏览 14276

拜仁官方:后卫斯塔尼希奇今日回归合练

懂球帝 浏览 926

合租女孩不穿内裤 男室友将其推倒:你有想法就直说嘛

观法浅说 浏览 86151

媒体:中美俄同一天都有重大发布 情况罕见

上观新闻 浏览 92847

联合国官员:加沙地带海上人道主义走廊短时间内难起效

极目新闻 浏览 12168

林子祥和学生结婚,78岁开演唱会,依然一票难求

犀利辣椒 浏览 853

郭磊:如何认识最新的出口数据和出口形势

首席经济学家论坛 浏览 984

蔚来ET5T暗影套装限定版上市 售价31.6万元

车质网 浏览 968

“减负”三令五申,是谁又在制造暑期焦虑?

环球网资讯 浏览 15397

李在明告诉CNN:不能将中国拒之门外

环球网资讯 浏览 4023

iPhone手机半夜“自动给陌生人打电话” 苹果客服回应

极目新闻 浏览 12074

大败局中,理想汽车大转折

帮宁工作室 浏览 10900

湖南这一夜,郭碧婷的“水桶腰大饼脸”,是对内娱畸形审美的反击

娱乐圈笔娱君 浏览 12721

250亿基金两年暴亏49%, 百万基民损失100亿,银华基金焦巍被市场先生打懵了

探长读财 浏览 16665

新一代奥迪A6L申报工信部:配置给满、V6 3.0T瞩目,拥有稀缺卖点

驾仕派 浏览 72

以军在加沙城行动最新画面公布

环球网资讯 浏览 1690

蓝军太难黑猫太黑!切尔西一周内两张脸

体坛周报 浏览 821

中方宣布制裁对台军售美企,制裁力度历史罕见

趣看热点 浏览 25879
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1