关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者774人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

长城突发!欧洲总部解散、解雇所有员工

电动知家 浏览 11309

杨幂化身女保洁摆拍,被男保镖簇拥尽显女王范

深剖娱乐圈 浏览 15593

俄媒指美方炒作苏罗维金被捕:企图撼动俄国内局势

环球网资讯 浏览 15686

借助配饰的力量,穿搭瞬间点睛

瑞丽伊人风尚 浏览 19791

这才是早春值得照搬的穿衣技巧,简约又高级,奔四女人穿出气质美

Yuki时尚酱 浏览 12886

曾志伟儿子曾国祥执导的电影《少年的你》入围今届奥斯卡最佳国际电影的最后5强

趣看热点 浏览 26644

看了这些春季穿搭才发现,“优雅风”显气质!40岁女人试试看

静儿时尚达人 浏览 11533

马上评|快递柜免费保管时间该多长,谁说了算?

澎湃新闻 浏览 10775

美联储暗示提高通胀目标?“新美联储通讯社”放风或青睐2.8%

华尔街见闻 浏览 19192

脱口秀演员池子与笑果文化和平解约,并为自己此前的举动道歉

趣看热点 浏览 26233

俄乌冲突第二年:从巴赫穆特到阿夫杰耶夫卡

环球网资讯 浏览 12472

中国色特别策划 | 故宫活力与故说新语

时尚COSMO 浏览 658

细节优化,2025款大众高尔夫GTI实车图像曝光

天天汽车 浏览 12568

今年流行的多巴胺穿搭,太减龄了!

小西的穿搭日记 浏览 16705

E句话 | 为什么没回去当教练?郭晶晶的回答很坦诚

仙女事件簿 浏览 10818

博时资本红利增强策略&波动增利策略:一边收息一边薅波动

私募排排网 浏览 996

范子铭晒照低烧37度5:千防万防没防住生病,打广东就开始了

懂球帝 浏览 12924

要摊牌邮报:桑乔将与滕哈赫直接对话,有人认为滕帅优待安东尼

直播吧 浏览 14194

孙艺珍产后首个官方行程亮相:容貌身材状态满分

素素娱乐 浏览 15636

新势力洗牌激烈:零跑、华为双雄争霸 方程豹斗败“蔚小理”

道哥说车 浏览 215

世体:拉波尔塔周一中午抵达体育城,向球队重申支持和鼓励

懂球帝 浏览 817
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1