关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻2928人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

伊朗称美国在伊核问题上“没有认真的谈判态度”

国际在线 浏览 2305

机酒价格普降两成 出境错峰游正当时

北京商报 浏览 2869

没想到,45岁隋俊波秒了25岁王影璐,她一直没火太可惜了

温柔娱公子 浏览 2419

"90后"王兴兴:小学时想当科学家 同学一句话启发了我

中国新闻周刊 浏览 7960

俄外交部:扎波罗热核电站归属俄罗斯不容置疑

上观新闻 浏览 3571

西方14国发布联合声明 有乌克兰参与但没有美国

新民晚报 浏览 8317

在特斯拉model Y和小米 YU7里二选一,怎么选?

蜗牛车志V 浏览 1621

张水华重马创个人第二好成绩 丈夫解释她嘴唇发黑

极目新闻 浏览 6039

43岁张杰正式宣布退出!原因令人意外

吴蒂旅行ing 浏览 1540

向太儿子向佑近照流出 威胁父母“不给钱我就去借”

鲁中晨报 浏览 6351

不出意外霍启山很难结婚不是因为他遇到自己

科学发掘 浏览 2017

郑丽文就职演说让马英九流泪 台媒:他看见蓝营的希望

海峡导报社 浏览 8526

西蒙尼:要变得更强,朱利亚诺必须努力、谦虚并保持当前状态

懂球帝 浏览 2576

隆源股份历史合资身份或存涉税风险,寄售库存商品监盘比例竟不足1%,国金证券是否尽责?|读懂IPO

时代周报 浏览 1776

一小米SU7在行驶中突然失控:前轮车轴完全断裂

PChome电脑之家 浏览 2794

知名博主喊话沈伯洋 用"吉林一号"公布其居住、工作地

澎湃新闻 浏览 16989

陈运拿下华锋股份意欲何为

北京商报 浏览 2372

不管人情世故那一套!东风日产法务贴脸开大,直接点了友商的名

小李车评李建红 浏览 2216

告别8GB时代!iPhone 18将升级为12GB内存:苹果已提前采购

快科技 浏览 2690

以军攻势升级 加沙两天内超4万人流离失所

澎湃新闻 浏览 3569

荣梓杉出轨约妹照曝光!与李禹熹控诉时间吻合,还曾要求对方删照

萌神木木 浏览 2353
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1