关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻2923人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

《繁花》声明翻车!官微开始紧急删评,主演胡歌唐嫣等全被牵连

萌神木木 浏览 2474

今年秋天最火的4条裙子,配玛丽珍鞋绝美!

LinkFashion 浏览 2812

媒体:中美元首会晤让赖清德坐立不宁、寝食难安

环球时报新闻 浏览 13539

伊利契奇:有人出钱让我讲述经历;加斯佩里尼让我突破极限

懂球帝 浏览 2876

以军称被扣押人员全部返还前不会停止打击哈马斯

新京报 浏览 2594

小马智行第七代 Robotaxi 自动驾驶出租车正式投运,成本下降70%

IT之家 浏览 2521

普京:俄罗斯对任何国家都不构成威胁

央视新闻客户端 浏览 7838

殷桃|每个表情都让人欲罢不能

农城浪子 浏览 1745

社评|立足新起点 奋力开新局

中国企业家杂志 浏览 1846

4岁女童20楼坠至13楼被业主拽住 邻居们接力苦撑4分钟

极目新闻 浏览 19055

秋季穿衣原来如此简单!记住这几组穿搭公式,得体简约又耐看

静儿时尚达人 浏览 2632

美业数字化再添新助力 成都美博会AI美业工具受追捧丨新经济观察

封面新闻 浏览 2736

赵丽颖好事将近?闺蜜给她的生日祝福好微妙,被怀疑恋情有新进展

萌神木木 浏览 2728

票房炸裂,口碑崩塌,《731》到底值不值得我们为它买单

最爱酷影视 浏览 3657

退休三年后“落马”,恒邦财险原董事长肖晓华被查

蓝鲸Insurance 浏览 1652

从小鹏的“物理AI”,看中国智能化的下一步

观察者网 浏览 2479

TA:告别全白球衣,阿森纳将在足总杯第3轮穿回传统红白球衣

懂球帝 浏览 1783

连续三个月创历史新高 蔚来公司10月新车交付首超4万台

网易汽车 浏览 2548

普通人衣服没必要买太多,准备好这些实用的单品,百搭又舒适

静儿时尚达人 浏览 2657

与中国“交好”,拿盟友“开刀”,战略已明朗

浏览 25619

印媒怒了:美国人组团恶意抢机票 阻止印度人返回美国

环球时报 浏览 26242
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1