关闭广告

清华联合字节跳动:AI学会用图像思考,让机器像人一样推理世界

科技行者1577人阅读


这项由清华大学和字节跳动Seed联合发起的研究于2026年1月发表,论文编号为arXiv:2601.19834v1,研究团队提出了一个颠覆性观点:让AI通过生成图像来进行推理,就像人类在头脑中构建"心理图像"一样思考问题。这种全新的推理方式可能彻底改变我们对人工智能的认知。

当你试图回想家里客厅的布局,或者想象将一张纸折叠后打孔会形成什么图案时,你的大脑会自动生成各种视觉画面。这些"脑海中的图像"帮助你理解空间关系,预测物理变化,解决复杂问题。而目前的AI系统,包括ChatGPT这样的语言模型,主要依靠文字进行推理,就像一个只会纸上谈兵的理论家,缺乏直观的视觉理解能力。

研究团队发现了一个有趣现象:尽管当前AI在数学和编程等抽象领域表现出色,但在涉及物理世界的空间推理任务上却表现糟糕,甚至连小孩子都能轻松解决的问题都会出错。这就好比一个学富五车的学者,能够背诵大量理论知识,却不知道如何在现实中应用这些知识。

为了解决这个问题,研究团队开发了一种全新的推理模式。传统AI就像一个只能通过语言描述来理解世界的人,而他们的新方法让AI能够"看到"和"想象"画面,在推理

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

冬天的“外套”别随便买!40+女人锁定这3款,优雅大气还保暖

静儿时尚达人 浏览 2279

乌官员:袭击乌方设施的俄"榛树"导弹未携带弹头

环球网资讯 浏览 1690

德国军事人员突然撤离格陵兰岛 原因不详

财联社 浏览 1707

以总理内塔尼亚胡与高级官员讨论伊朗紧张局势

国际在线 浏览 1468

“这件大衣”今年冬天又火了,怎么搭都高级!

LinkFashion 浏览 2109

杭州巨准斥资超8亿入主华是科技,能否力挽狂澜?

览富财经网 浏览 1589

孙颖莎脚踝伤势或不严重!行走自如+下蹲轻松 回京养伤坐等乒超?

颜小白的篮球梦 浏览 2097

齐溪晒二胎宝宝正脸!身材发福明显

松林侃世界 浏览 1783

300353,重大资产重组!明日复牌

中国基金报 浏览 2533

电动Jeep曝新国产计划:或使用猛士技术,首车在2027年上市

明镜pro 浏览 2892

福建舰更多细节公布 一组动图全方位看清楚

央视新闻客户端 浏览 2007

不一定能掀桌男主,但一定是个好演员!

伊周潮流 浏览 1532

特朗普行政令降低大麻管制等级,投资者“卖事实”,大麻股普跌

华尔街见闻官方 浏览 2018

华为Mate 80系列手机获HarmonyOS 6.0.0.120系统重要补丁推送

IT之家 浏览 2138

俄朝站队怒批高市 特朗普迅速与日切割中方警告很罕见

现代小青青慕慕 浏览 46787

今年秋冬最流行的4组搭配,照着穿美出新高度!

LinkFashion 浏览 2220

天越冷社交欲望越低,是我的问题吗?

时尚COSMO 浏览 2168

美印友谊的中流砥柱被FBI大张旗鼓拘捕 被控"串通中国"

澎湃新闻 浏览 8303

深圳水贝疑有黄金原料供应商暴雷跑路:有人被卷400万

大风新闻 浏览 25258

图片报:多特有意巴萨小将吉列,球员合同2027年到期

懂球帝 浏览 2825

小鹏汽车CEO何小鹏:所有核心产品线都要走向全球市场

IT之家 浏览 1802
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1