关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻2924人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

从造豪车到百万亿美元公司,追觅俞浩:怕我们膨胀,但我们稳得很

贝壳财经 浏览 1624

陈妍希带娃现身海口,儿子小星星近状曝光,母子俩牵手同行好温馨

扒虾侃娱 浏览 2070

聚焦AI+畜牧,刘松柏攻破鸡味密码,打造终身学习广东样本

南方都市报 浏览 933

ST路通内斗激化!“资本大佬”吴世春“抄底”遭遇绊脚石

野马财经 浏览 2631

若昂-内维斯卖便宜了?坎波斯:我们为他支付的价格很合理

懂球帝 浏览 1980

大疆Osmo Pocket 4云台Vlog相机被曝3月发布,分标准/Pro版

IT之家 浏览 1693

卫报:曼苏尔和芬威集团的第三大股东曾成立一家联合投资公司

懂球帝 浏览 2521

纪念戴安基顿,伍迪艾伦最高杰作告别放映❤️

幕味儿 浏览 1688

消失5个月后泰禾黄其森“归来”

地产深度报道 浏览 1804

A股2025年分红额创历史新高 分红次数居前上市公司名单一览

财联社 浏览 1938

特朗普:加沙停火协议“非常接近达成” 本周末或去中东

央视新闻客户端 浏览 16824

四川阿坝红旗桥垮塌:系山体变形加剧滑塌造成

新京报 浏览 31076

严屹宽老婆41岁生日,婆婆送杜若溪万元大红包

爱八卦的晓请 浏览 1449

美国务卿:希望泰柬下周停火

新华社 浏览 1997

风扇网红小玉租70元婚纱,在出租屋与大鹏结婚

深析古今 浏览 3400

女孩引产遭拒生女婴被医生"送人" 抱养方称捡弃婴露馅

澎湃新闻 浏览 9213

前三季度私募产品“超涨”十强!复胜、远信、歌汝等夺冠!

私募排排网 浏览 2886

向华强说娱乐圈明星美女他看不上眼:除了向太其他都没什么了不起

韩小娱 浏览 1582

曾1600元一粒难求的片仔癀,如今跌至六七百元!药房:买得多可以优惠

红星资本局 浏览 2589

曼晚:无论卡里克成绩如何,恩里克、纳格尔斯曼顺位在他前面

懂球帝 浏览 785

《余生有涯》:就算原生家庭烂,也别劝我投降

澎湃新闻 浏览 2852
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1