关闭广告

Meta团队揭秘大模型"视觉天赋"之谜:文本训练竟能培养看图能力

科技行者758人阅读


这项由Meta超级智能实验室和牛津大学的韩俊林、汤盛邦、范大卫等研究团队完成的重要研究,发表于2025年1月,论文编号为arXiv:2509.26625v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

近年来,一个令人困惑的现象开始引起科学家们的注意:那些只用文字训练的大型语言模型,竟然在处理图像任务时表现出了惊人的能力。这就好比一个从未见过画笔的人,仅仅通过阅读绘画理论书籍,就能画出精美的作品。这种看似不可能的现象背后究竟隐藏着什么秘密?

Meta的研究团队决定深入探究这个谜题。他们发现,当我们给这些"纯文字出身"的AI模型配上视觉编码器,然后进行少量的多模态训练后,它们就能在各种视觉任务中表现得相当出色。更令人惊讶的是,有些模型甚至在从未"见过"图像的情况下,就能完成某些视觉推理任务。

为了彻底理解这种现象,研究团队设计了一套系统性的实验方案。他们像调配食谱一样,精心调配不同类型的文本数据,训练了超过100个不同规模的模型,消耗了50万GPU小时的计算资源。这项研究的规模之大,就像是在建造一个巨大的实验工厂,专门用来生产各种"口味"的AI模型。

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

新研究发现 AI 的最大破绽:不是不够聪明,而是不会“骂人”

IT之家 浏览 671

三节三双!东契奇前三节26中14砍下38分11板10助

直播吧 浏览 12971

果汁厂倾倒果渣疑产生有毒气体致3死 其中1人准备结婚

上观新闻 浏览 79092

中俄防长1年见3次 西方舆论嫉妒:中美防长一直没约成

上观新闻 浏览 87140

迪士尼,10亿美元投资OpenAI

中国基金报 浏览 27

杨颖带儿子现身机场 私服全身配饰近10万忙着赶路

萌神木木 浏览 14415

父母先后失联兄弟流浪4岁弟弟又失踪 36年后母子团圆

红星新闻 浏览 5113

普京:俄政府一年内曾向"瓦格纳"提供了超860亿卢布

环球网 浏览 89264

《侍神令》亏了6.1亿,沉寂4年,陈坤新片又来了,票房仅3.7万

靠谱电影君 浏览 831

比尔狂砍60分创新纪录,奇才5分之差惜败76人

趣看热点 浏览 26252

当《蚁人》照进现实: 西湖大学造出能爬会游、摔不坏的“机器小强”

都市快报橙柿互动 浏览 1624

千万富翁王晓举寻亲成功,妻子举动让人泪目

史行途 浏览 1667

新能源汽车的轮胎,为啥那么贵?

小李车评李建红 浏览 785

海事局:北部湾部分海域进行军事训练 禁止船舶驶入

环球网资讯 浏览 14530

欧洲杯-葡萄牙点球3-0斯洛文尼亚 进8强战法国

网易体育 浏览 62910

2023春夏流行衬衫 利落干练更有时髦气质

Bordine的时尚时刻 浏览 16808

中东棋局骤变:美以\"师徒反目\"暗流汹涌

浏览 4555

“塌房失败”的李雪琴给所有人上了一课

乡野小珥 浏览 538

女子急寻人:和去世丈夫攒下百万 想给40年没见的女儿

杭州网 浏览 93954

24岁火辣女星被发现在家离世!常有人花钱虐待侵犯她,留下一幼子

文艺圈娱乐号 浏览 12899

2025年10月我国新能源汽车销量占比超50% 历史首次!

智车情报局 浏览 598
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1