关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者1570人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

泽连斯基:乌谈判团队将于2日晚前往乌美俄三方会谈地点

国际在线 浏览 1486

俄罗斯核潜艇在北太平洋成功试射超音速巡航导弹

环球网资讯 浏览 3553

或预示未来设计风格 现代汽车发布全新硬派SUV概念车

乐选爱车 浏览 2116

周星驰发文悼念梁小龙,直言永远怀念对方,两人曾因拍戏反目多年

萌神木木 浏览 1654

今年秋天的卫衣,放松穿最好看!

LinkFashion 浏览 3328

4400亿!中证A500指数基金一周年:总规模增近50%,近80家基金公司下场

券商中国 浏览 3495

新一代理想L9电池加码体型加大 重夺高端话语权

网易汽车 浏览 1595

字母哥主动招募布克? 雄鹿有能力引进他吗?

仰卧撑FTUer 浏览 1001

卫星图像显示以军坦克集结加沙城周围

环球网资讯 浏览 3561

美联储理事米兰再次呼吁加快降息,断言“潜在”通胀接近目标,称任期或延长

华尔街见闻官方 浏览 2036

换装纯电动力系统 全新日产JUKE谍照曝光

车质网 浏览 2051

宗馥莉“被带走”?谣言背后,一个内讧的娃哈哈

大猫财经Pro 浏览 2446

今年秋天最流行的风衣,“短一点”才时髦!

LinkFashion 浏览 2215

比利亚雷亚尔下赛季预算达到2.15亿欧,创下俱乐部纪录

懂球帝 浏览 2012

华为Sound X获HarmonyOS 6.0 Beta升级,新增AI搜歌等功能

IT之家 浏览 2127

男子吃饭像兔子去治疗 蒙眼做手术听到医生一句话懵了

1818黄金眼 浏览 31351

35岁男子回乡"崖下洞居" 创业失败家里没房欠银行35万

封面新闻 浏览 15077

AI聊天机器人背后的肯尼亚劳工:每条“我爱你”付费0.05美元

DeepTech深科技 浏览 2026

荷甲副班长阿尔梅罗大力神8-2横扫兹沃勒,霍恩坎普帽子戏法

懂球帝 浏览 2592

亚历山大:我当然想超越科比,能否做到让我们拭目以待吧

懂球帝 浏览 2832

HuggingFace发布实战指南,从决策到落地手把手教你训练大模型

机器之心Pro 浏览 2071
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1