关闭广告

10倍压缩率,97%解码精度!DeepSeek开源新模型,为何赢得海内外关注

澎湃新闻916人阅读

DeepSeek开源新模型:用视觉模式实现上下文压缩。

10月20日,DeepSeek宣布开源最新大模型DeepSeek-OCR。所谓的OCR,据DeepSeek在论文中解释称,是通过光学2D映射压缩长上下文可行性的初步研究。DeepSeek-OCR由两部分组成:DeepEncoder和作为解码器的DeepSeek3B-MoE-A570M。DeepEncoder作为核心引擎,设计为在高分辨率输入下保持低激活,同时实现高压缩比,以确保视觉tokens数量优化且可管理。

通俗而言,这是一种视觉-文本压缩范式,通过用少量的视觉token来表示原本需要大量文本token的内容,以此降低大模型的计算开销。

据公布的论文名单显示,该项目由DeepSeek三位研究员Haoran Wei、Yaofeng Sun、Yukun Li共同完成,但这三位核心作者都颇为低调,其中一作作者Haoran Wei曾在阶跃星辰工作过,曾主导开发旨在实现“第二代 OCR”的GOT-OCR2.0系统。


DeepSeek-OCR的架构分为两部分。一是DeepEnco

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

联合国秘书长:大型科技公司在追逐AI利润过程中带来风险 呼吁紧急加强监管

观点机构 浏览 12067

穆尼奥斯:队员们的努力配得上这场比赛,只是结果没达到预期

懂球帝 浏览 1593

蜜雪冰城开卖啤酒:价格5.9元至14.9元不等 只能外带

极目新闻 浏览 5020

五粮液能“平替”茅台?

虎嗅APP 浏览 17116

窦骁现身影院支持张艺谋女儿新片 全程忙前忙后

扒虾侃娱 浏览 13832

谁最有资格参与中国版的马斯克宏图计划?

虎嗅APP 浏览 15930

新华鲜报|向着8万海里!中国第42次南极考察队起航

新华社 浏览 718

斥资5000万美元,Meta前CTO让海洋帮忙除碳

DeepTech深科技 浏览 16341

原来他们是爷俩,冷漠父子藏实力!低调逆袭

章眽八卦 浏览 936

瞄准"比黄金更令人垂涎"的锑资源 阿拉斯加州掀采矿热

澎湃新闻 浏览 4983

最高涨价28%,老铺黄金年内第三次调价,今年已累计涨约50%

红星资本局 浏览 808

孟菲斯·德佩,荷兰射手王+助攻王

体坛周报 浏览 1041

杨幂六一儿童节为10岁女儿送生日祝福,喊小糯米“我闺女”好亲昵

娱絮 浏览 10907

霍启刚晒父子4人合照 齐聚北京纪念霍英东百年诞辰

娱絮 浏览 18685

王家卫持续被扒!《东邪西毒》事件推锅临时工

boss外传 浏览 646

华大智造上半年营收14.4亿:同比降39% 净亏9803万

雷递 浏览 14867

baby妇女节晒美照,清纯甜美如初恋,与超大玫瑰同框引猜疑

深剖娱乐圈 浏览 12402

国家统计局:4月下旬生猪价格上涨4.3%

中新经纬 浏览 17841

夏日衣橱里的裙子,越长越时髦

巧百搭 浏览 16471

英媒:梅努担心能否参加世界杯,热刺和纽卡在考虑签下他

懂球帝 浏览 813

女生醉驾撞死3人最小死者未满3岁 至今未接触死者家属

极目新闻 浏览 18249
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1