关闭广告

浙江大学最新研究:让AI像人类一样"转头看"来回答问题

科技行者1738人阅读


当你要找钥匙时,你不会站在门口不动,而是会走来走去、弯腰低头、换个角度仔细观察。同样道理,当AI要理解一个三维场景并回答相关问题时,也应该能够主动调整视角,而不是被困在几张固定的照片中。这正是浙江大学ZIP实验室联合莫纳什大学和阿德莱德大学AIML实验室在2026年1月发表的最新研究要解决的核心问题。

这项发表在arXiv预印本服务器上的研究(论文编号:arXiv:2601.05172v1)提出了一种名为"视角链"(Chain-of-View,简称CoV)的创新框架。研究团队发现,现有的视觉语言模型在面对复杂的三维环境问题时,往往受限于固定的输入视角,就像一个人只能透过几个固定的窗户观察外面的世界一样。而他们的新方法让AI能够像真正的探索者一样,主动移动和转动"视线",从不同角度收集信息,最终给出更准确的答案。

这项研究的独特之处在于它完全不需要额外的训练,就能让现有的AI模型具备"主动观察"的能力。研究人员在OpenEQA、ScanQA和SQA3D等权威测试数据集上进行了大量实验,结果显示这种方法平均提升了11.56%的表现,最高提升幅度达到了13.62%。更令人兴奋的是,随着AI"观察步数"的增加,它的表

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

从对手到盟友,刘强东王兴联手要“联吴抗曹”?

BT财经 浏览 2725

引力一号遥二运载火箭发射成功

环球网资讯 浏览 2855

沃勒尔:罗马虽然输掉了与米兰的对决,但他们表现更胜一筹

懂球帝 浏览 2503

NVIDIA推出ChronoEdit:让AI图像编辑拥有物理常识的革命性技术

科技行者 浏览 2501

E句话| 他们将补办婚礼?

仙女事件簿 浏览 2334

递交亮眼成绩单!中国人寿前三季度新业务价值强劲增长41.8%

证券市场周刊 浏览 2700

日本外务省高官今日访华 将解释高市早苗言论

界面新闻 浏览 42583

伊姐周六热推:电视剧《不眠日》;电视剧《照镜辞》......

伊周潮流 浏览 4591

特朗普:将很快对拉丁美洲贩毒行动展开“地面打击”

环球网资讯 浏览 2276

桑托斯3-1科林蒂安,罗埃塞点射破门,巴雷亚尔传射

懂球帝 浏览 2963

他陪了林青霞21年,眼睁睁看着她嫁给别人

二妹扯娱 浏览 2649

阿森纳10月最佳候选:加布里埃尔、赖斯、萨卡、廷贝尔

懂球帝 浏览 2588

特斯拉大涨超3%创年内新高,AI叙事主导涨势

华尔街见闻官方 浏览 1997

华为MateBook Pro电脑通过OpenHarmony 6.0 Release认证

IT之家 浏览 1626

中央一号文件来了!今年有哪些“新表述”?

农民日报 浏览 1532

博斯:19轮联赛打进72球,这足以说明拜仁的实力有多强

懂球帝 浏览 1509

首次庭审细节披露:马杜罗声音洪亮 称自己是战争囚犯

看看新闻Knews 浏览 5475

男子如厕突发不适后去世 从倒地到失去意识仅1分钟

上观新闻 浏览 2640

申花亚冠赛季首胜!连战蔚山首尔不败,阿苏埃建功,延续5大纪录

奥拜尔 浏览 2802

又一中将在俄境内被炸死 俄方或实施对等定点清除行动

新民晚报 浏览 29482

田震国籍争议再发酵:明星养病选国外总造质疑

娱乐欣赏图 浏览 2028
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1