关闭广告

复旦大学等顶尖高校联手研发:AI模型学会像侦探一样使用工具

科技行者1521人阅读


这项由复旦大学、同济大学、新加坡国立大学、华盛顿大学、电子科技大学以及香港中文大学联合开展的研究发表于2026年1月,论文编号为arXiv:2601.18631v1,为多模态大语言模型的工具使用能力带来了重大突破。

现代人工智能模型就像是刚学会看图识字的学生,虽然能够理解图像内容,但在面对需要多步推理的复杂视觉任务时往往力不从心。比如让AI规划一条从起点到终点的安全路径,既要避开障碍物,又要找到最短路线,或者让AI完成拼图游戏,需要理解图像的整体结构和局部细节。这些任务对人类来说相对简单,但对AI来说却是巨大挑战。

正如人类在遇到超出自身能力的问题时会借助工具一样,研究团队提出了一个革命性的想法:让AI模型学会主动使用各种视觉工具来解决复杂问题。这就好比教会一个学生不仅要会做题,还要知道什么时候该用计算器,什么时候该用尺子,什么时候该用放大镜。

研究团队开发的AdaReasoner系统就像是培养了一位经验丰富的侦探。这位AI侦探不仅具备基本的观察能力,更重要的是,它学会了在破案过程中灵活运用各种侦查工具。当遇到需要精确定位的线索时,它会使用"放大镜工具";当需

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

米哈游持股11.86%,Suplay冲刺“收藏级卡牌第一股”|港E声

时代周报 浏览 1839

曝奔驰考虑与长城汽车共享南非工厂

盖世汽车 浏览 736

豪门离婚,窦骁能分到多少?

江湖人称艾掌门 浏览 2664

冬天穿衣其实很简单!上短下长、加点亮色,高级舒适又耐看

静儿时尚达人 浏览 1755

空军发布重磅视频 多款新型战机亮相

参考消息 浏览 1764

马里兰大学与英特尔:AI视频字幕自动评分系统

科技行者 浏览 2748

消息称LPDDR5X内存价格持续飙升,涨幅可抵2亿像素潜望镜

IT之家 浏览 2700

马筱梅晒定制红包,把婆婆张兰放感谢第一位

大中国 浏览 1002

春天第一条裙子,这么穿!

黎贝卡的异想世界 浏览 693

"荒野求生"48万元奖金被平分 选手:这点钱不够盖房子

极目新闻 浏览 8126

百亿私募一站式出海!招商证券打造跨境服务生态

券商中国 浏览 1963

南部战区:正告菲方停止在南海挑起事端

北京日报客户端 浏览 3599

高市早苗APEC会议期间与台湾地区人员会面 国台办回应

澎湃新闻 浏览 7860

全是感动!《许我耀眼》33集大结局,是我今年看过最泪奔的大结局

娱乐圈笔娱君 浏览 2781

聚焦精准营养!英氏控股以科研创新引领婴幼儿辅食产业升级

时代周报 浏览 1991

维持看涨!摩根大通预计金价明年底均价升至5055美元

第一财经资讯 浏览 2775

以色列警告加沙居民:只剩最后机会撤离

环球时报国际 浏览 2901

章子怡带醒醒追星宋雨琦,母女俩飞日本看演唱会,后台合影超开心

扒虾侃娱 浏览 2877

周星驰发文悼念梁小龙,直言永远怀念对方,两人曾因拍戏反目多年

萌神木木 浏览 1654

腾讯元宝派宣布支持接入OpenClaw

环球网资讯 浏览 607

名利双收的成龙,每天为43岁的儿子操碎了心!

叨唠 浏览 1943
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1