关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻2921人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

特朗普连绵不绝的骚操作高到了大气层!

宋鸿兵 浏览 2668

吉林长春中东新天地购物公园:丰富多元体验 焕新商业地标

中国商报 浏览 1965

洪都拉斯3-0大胜海地,奎奥托、安东尼-洛萨诺建功

懂球帝 浏览 2823

泽连斯基:乌谈判团队将于2日晚前往乌美俄三方会谈地点

国际在线 浏览 1485

前三季度私募产品“超涨”十强!复胜、远信、歌汝等夺冠!

私募排排网 浏览 2884

台学者:台当局不办光复节活动 人民无法接受

环球时报新闻 浏览 8210

美国被指对伊朗行动的准备在两周内完成

潇湘晨报 浏览 1500

2026春夏一定要拥有的6只包,好看又百搭

LinkFashion 浏览 699

弹无虚发,凯恩德甲18次罚点全中

体坛周报 浏览 2735

纯电续航提升 新款小鹏X9纯电版申报图曝光

车质网 浏览 2005

一篇搞懂:飞书多维表格、n8n、Dify 等自动化工作流里的 Webhook 到底是个啥

钛媒体APP 浏览 2858

辽宁一小米SU7起火 疑似车内易燃物点燃

网易汽车 浏览 1324

精致穷,我们在为“符号消费”买单

时尚COSMO 浏览 2906

瓜帅:维拉一直是最难对付的对手;多库的1对1能力让他很特别

懂球帝 浏览 2683

E句话|“我只眼神给出去”?黑白颠周媛账号被封

仙女事件簿 浏览 1569

胜辽宁发布会!潘江赞对手,亲承张宁将缺席三周,迪亚洛总结不足

篮球资讯达人 浏览 1682

西北大学教授刘建妮 被撤销“中国青年女科学家奖”

每日经济新闻 浏览 24844

博洛尼亚-佛罗伦萨,瓦诺利:“这场胜利是为了带来喜悦。将罗科留下的价值观带到场上”

绿茵情报局 浏览 1670

首款中国超跑,比亚迪仰望 U9 将入驻《GT 赛车 7》

IT之家 浏览 2716

瓷器店里的蛮牛?非也! 兰博基尼在华20年成长路

网易汽车 浏览 2729

镜报:格拉利什对阵曼城需要回避,这让英超的公平性受到损害

懂球帝 浏览 3001
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1