关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro1705人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

立案!光环下的清越科技,藏着多少“秘密”?

财经下午茶 浏览 2668

被霍尔木兹海峡"困"住 中国货代2周损失140万焦头烂额

新京报 浏览 96184

美股半导体板块,集体下跌

第一财经资讯 浏览 1612

一夜进账244亿元!李斌靠爆款车翻身,破除蔚来倒闭魔咒,

象视汽车 浏览 3143

魏牌9年换9帅,魏建军:他们自己感觉压力大

雷达财经 浏览 1964

最高法改判福清祖屋强拆案后 屋主再提诉讼

澎湃新闻 浏览 2790

闫学晶风波再次升级,娱乐圈多位明星躺着中枪,唯独一人成为赢家

徐帮阳 浏览 1662

我国高原大型无人机物流航线首次验证飞行成功,北川成关键落地节点

红星新闻 浏览 1697

从“提效”到“稳进”:2026直播电商进入精耕细作时代

惊蛰研究所 浏览 1626

今年冬天最流行搭配:裤子+靴子,高级又时髦!

LinkFashion 浏览 2291

队报:马尔基尼奥斯伤病恢复慢于预期,将缺席本周法甲比赛

懂球帝 浏览 2834

西班牙足协主席:我们会充分照顾球员利益,俱乐部可以放心

懂球帝 浏览 2612

媒体:在21世纪20年代 美国总统要向外派出"总督大人"

新民周刊 浏览 5265

荣耀 MagicPad3 Pro 13.3 平板电脑核心参数公布:165Hz LCD 面板

IT之家 浏览 3332

塞梅尼奥立竿见影,曼城10球隔山敲打阿森纳

体坛周报 浏览 1769

贝克汉姆家闹出大瓜!豪门大戏再添新章

观察鉴娱 浏览 3256

康师傅换帅!创始人之子接棒CEO,去年薪酬937万元

中国基金报 浏览 2090

马德里康普顿斯大学VERSE:AI实现文档视觉信息深度理解

科技行者 浏览 1669

《不眠日》大结局!墨远致是乌贼

丹妮观 浏览 3487

展映11天!北京国际电影节正式官宣

幕味儿 浏览 583

马筱梅晒定制红包,把婆婆张兰放感谢第一位

大中国 浏览 1011
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1