关闭广告

让大模型“瘦身”90%!清华&哈工大提出极限压缩方案

量子位12399人阅读

徐玉庄 投稿
量子位 | 公众号 QbitAI

对大模型进行量化、剪枝等压缩操作,是部署时最常见不过的一环了。

不过,这个极限究竟有多大?

清华大学和哈工大的一项联合研究给出的答案是:

90%。

他们提出了大模型1bit极限压缩框架OneBit,首次实现大模型权重压缩超越90%并保留大部分(83%)能力。

可以说,玩儿的就是“既要也要”~



一起来看看。

大模型1bit量化方法来了

从剪枝、量化,到知识蒸馏、权重低秩分解,大模型已经可以实现压缩四分之一权重而几乎无损。

权重

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

特朗普扬言要撒"关税红利":反对关税的人都是傻瓜

财联社 浏览 6128

俄防长突访前线 疑隔空回应布林肯:俄将奉陪到底

直新闻 浏览 19301

AI“碰撞”量子 一场颠覆未来的创新变革在这里诞生

上观新闻 浏览 1572

淘特回应团队大部分人员合并到淘宝:业务有调整,不会并入淘宝

Tech星球 浏览 18762

蔡英文正与台空军通话 一旁疑传出解放军喊话声音

环球网 浏览 88901

宝马的保守与变革:MINI 披上新势力外衣

晚点LatePost 浏览 11227

华为车BU新公司“引望”正式成立 注册资金10亿

网易科技报道 浏览 12751

希尔德:追梦可能是篮球史上的最强防守者,他在防守端功力深厚

懂球帝 浏览 1030

巴以冲突百天致2.4万人死亡 多国爆发大规模抗议

环球网资讯 浏览 12792

《南来北往》大结局:牛大力姚玉玲喜生贵子,最终家庭事业双丰收

肆季娱乐 浏览 12634

NBA最新MVP榜:约基奇继续领跑,前6保持不变,詹姆斯获提名

懂球帝 浏览 12106

媒体人:前广厦外援卡明斯加盟周琦老东家东南墨尔本凤凰

直播吧 浏览 14674

男子吐槽一家医院"收费贵"遭起诉 被判"道歉并赔偿"

封面新闻 浏览 34159

特斯拉进入平价棋局 不足4万美元的新车又是鲶鱼?

禾颜阅车 浏览 999

持股市值惨遭“脚踝斩”,徐翔打响“资产保卫战”

华夏时报 浏览 18244

波利塔诺:我们应铭记输给埃因霍温,提醒自己要一直全力以赴

懂球帝 浏览 704

有品位的人,如何在雪地里“撒野”?

FUFASHION 浏览 13786

挪威队主帅:我们和阿森纳达成协议,厄德高不会在世预赛出场

懂球帝 浏览 627

博主:王子铭今天自行加练,周金辉、李明等高层现身训练基地

懂球帝 浏览 801

洛城德比票价水涨船高,美记:哈登不排除明日对湖人迎来首秀

懂球帝 浏览 13225

沙溢自曝曾吃了狗吃过的面发烧三天

青杉依旧啊啊 浏览 896
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1