关闭广告

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

机器之心Pro1458人阅读



魏熙林为本篇文章第一作者。魏熙林是复旦大学博士生,师从林达华教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。目前在上海人工智能实验室实习,指导 mentor 是臧宇航、王佳琦。

今天推荐一个 Implicit Chain-of-Thought(隐式推理) 的最新进展 ——SIM-CoT(Supervised Implicit Chain-of-Thought)。它直击隐式 CoT 一直「扶不起来」的核心痛点:隐式 token 一旦 scale 上去,训练就容易塌缩到同质化的 latent 状态,推理语义直接丢失。

SIM-CoT 的关键招式是一个 plug-and-play 的 step-level 监督模块:训练时用辅助解码器把每个 latent token「拉回」到可对齐的推理步骤上,既稳住优化、避免 collapse,又让隐式推理第一次真正可解释 —— 你甚至能把每个 latent token 解码成人类可读的中间推理步骤。

更爽的是:推理阶段零额外开销(辅助解码器训练完就丢),但效果却很猛:在 GPT-2 上相

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

闻泰与安世新一轮交锋来了 创始人:遭荷兰政府背叛

澎湃新闻 浏览 12257

王楚然172cm真实感,有谁不爱

蕾爸退休日记 浏览 1927

美国“难民”涌入,中国公知的天塌了!

浏览 25189

全面战胜ReAct!斯坦福全新智能体推理框架,性能提升112.5%

新智元 浏览 2326

美国务院批准向波兰出售“标枪”导弹系统

国际在线 浏览 3037

安东尼奥3年2次突破!成05国奥主帅热门,媒体人:结果大于过程

奥拜尔 浏览 1751

百亿私募大佬但斌有了"新身份":中国香港居民

每日经济新闻 浏览 3807

瑞士国防军司令:为应对"俄罗斯风险"必须增加军费

澎湃新闻 浏览 1916

还没从上周财报中缓过来!博通、甲骨文再下挫,AI基础设施板块继续遭抛售

华尔街见闻官方 浏览 2078

三年半亏19亿,行政处罚超400条,享道出行IPO了

市值Observation 浏览 2557

李璇:三镇开出国内球员顶薪与邓涵文续约,但没能续约成功

懂球帝 浏览 2194

摩托罗拉Edge 70 Ultra现身Geekbench,处理器或有新情况

IT之家 浏览 2435

被逼离队?曝56岁徐正源一直想与蓉城续约 退钱哥发文:感恩感谢

风过乡 浏览 2077

Meta实验室革命性并行推理技术:让AI模型思考速度提升50%

科技行者 浏览 1780

地缘因素引爆大宗狂欢!机构上调金价目标至5000美元,白银飙涨近8%,铜价再创里程碑

第一财经资讯 浏览 1747

今年流行的“新老钱风”,优雅又时髦,太适合春天了!

LinkFashion 浏览 934

大车要做大,小车更加要——工信部第399批新车热评

吴佩频道 浏览 2985

武汉女子遭遇APP投资骗局:起诉被驳回 警方又不立案

上游新闻 浏览 8559

福特中国人事调整:杨美虹3月底退休 李方方即将接棒

网易汽车 浏览 955

E句话| 女明星站个C位就要被封杀?

仙女事件簿 浏览 2719

手握低空经济王牌矩阵 上海向世界eVTOL之都迈进

看看新闻Knews 浏览 1689
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1