关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻937人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

观众对白百何的评价,明白了当年宋丹丹那番话

娱乐圈笔娱君 浏览 635

对特斯拉来说,马斯克值558亿美元吗?

盖世汽车 浏览 11005

彻底放弃纽约了?希音据称最早本周在伦敦提交招股意向书

科创板日报 浏览 10858

四轮单独控制,现代摩比斯MOBION概念车正式亮相

天天汽车 浏览 12841

激动!李靓蕾称与王力宏美国官司胜诉

文艺圈娱乐号 浏览 16683

特斯拉申报Model Y长续航后驱版 又是一个走量款

网易汽车 浏览 1026

41岁张靓颖的现状,给所有中年女性提了个醒

科学发掘 浏览 373

朱珠和丈夫牵手现身 王昀佳挺肚腩撞脸侯佩岑老公

娱絮 浏览 18694

罗志恒:三季度经济增速为何放缓?四季度经济前景如何?

首席经济学家论坛 浏览 918

55岁郑丽文当选国民党主席 其被视为"非典型国民党人"

中国青年报 浏览 4511

Selina晒儿子正面照庆生 一家三口合体

扒虾侃娱 浏览 13553

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者 浏览 773

合富中国的六连板“泡沫”

北京商报 浏览 698

内维尔:利物浦夏窗表现不佳与转会负责人员有关

直播吧 浏览 14452

弗里克:来巴萨后我变了,我也不希望孙子看到爷爷是这样的

懂球帝 浏览 872

盘点未夺大满贯的最强选手,谁是你心中的意难平?

网球之家 浏览 664

新能源车主自驾海南回不去重庆 无奈"抢"走老爸的油车

上游新闻 浏览 80320

俄罗斯一城市首次遭到无人机袭击 佩斯科夫证实

枢密院十号 浏览 89473

朝鲜首次试射“火星炮-18”导弹 金正恩现场指导

环球网资讯 浏览 18940

男子在千万豪宅小区买两车位 不能安装住宅用电充电桩

华龙网 浏览 88796

乌军从阿夫杰耶夫卡撤军 称俄军集结5万兵力

每日经济新闻 浏览 12771
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1