关闭广告

北大腾讯团队只改一行代码,让AI图像生成效果提升20%!

科技行者1518人阅读


这项研究由北京大学和腾讯混元实验室共同完成,并于2026年1月发表在计算机视觉领域的顶级学术期刊上。论文编号为arXiv:2601.17124,感兴趣的读者可以通过此编号查找完整的技术细节。

想象一下,你正在烘焙蛋糕,面前有两个不同的烤箱。一个烤箱只能设定几个固定的温度档位,比如低温、中温、高温,这就像是现在AI绘画中的"离散模式"。另一个烤箱可以精确调节到任意温度,就像"连续模式"。长期以来,AI图像生成领域就被这样分成了两个阵营,无法统一比较哪种方式更好。

但北京大学和腾讯混元的研究团队发现了一个巧妙的解决方案。他们注意到,现有的图像编码技术FSQ就像一个可以在两种模式间切换的烤箱,但这个烤箱有个致命缺陷:温度分布不均匀。大多数食物都挤在中间几个温度档位,而边缘的档位几乎用不到,造成了严重的"温度浪费"。

研究团队的洞察力在于,他们发现神经网络处理图像时产生的数据分布就像钟形曲线一样,大部分数值集中在中间,两端很少。但FSQ采用的是平均分布的量化方式,就好比用同样大小的盒子来装不同数量的物品,必然会造成中间的盒子装得满满当当,边缘的盒子却空空如也。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

中央巡视后卸任七年的姜德果被查 曾任唐山市委书记

中国新闻周刊 浏览 22791

5名共和党议员"倒戈" 特朗普"愤怒"向其打电话威胁

环球网资讯 浏览 12339

王传福:全世界NO.1的卷王

燃擎频道 浏览 1651

伊姐周日热推:电视剧《重影》;电视剧《山河枕》......

伊周潮流 浏览 2285

西部联体育主管被指控未经许可挪用好友资金,给俱乐部修球场

懂球帝 浏览 2736

伊朗外长:就伊朗核问题达成协议的唯一途径是外交

国际在线 浏览 1017

"太子集团"头目被指曾遭手下"黑吃黑" 后者已申请破产

红星新闻 浏览 7747

两个男演员冲上热搜!举止亲密惹关注

萌神木木 浏览 1682

拼多多“千亿扶持”落地半年,“包邮区”持续扩大,更多地区享受便利网购服务

雷峰网 浏览 2520

媒体:高市内阁就"雷达照射"贼喊捉贼 遭批国家的耻辱

新民晚报 浏览 19095

女明星混得好,玄学不能少

江湖人称艾掌门 浏览 1600

福建舰未来还会搭载哪些新型舰载机 专家解析

北京日报客户端 浏览 3359

她与名导同居多年被抛弃,如今复出却无人问津

吴蒂旅行ing 浏览 2180

英伟达联手诺基亚,能否复制“Wintel神话”

经济观察报 浏览 2553

预测票房26亿!除了中文配音拉胯,《疯狂动物城2》没任何毛病

最爱酷影视 浏览 2307

全运会男足U20大爆冷门!山东上海携手出局,湖北广东压哨绝杀

奥拜尔 浏览 2540

经典落幕:苹果正式将初代iPhone SE列为过时产品

环球网资讯 浏览 2196

福斯特:曼联看起来很有信心,但争4与曼城相比差距依然明显

懂球帝 浏览 2566

一城商行支行行长离开原岗位13年后被查

湘财Plus 浏览 1678

A股板块轮动加速 基金净值“跑偏”泄露调仓动向

证券时报 浏览 3361

八大国家队世界杯进球榜:克洛泽16球第1,大罗第2,梅西第3

懂球帝 浏览 2843
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1