关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者2724人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

"上海第一黄鱼面馆"塌房 当着执法队员面使用过期香干

潇湘晨报 浏览 30114

大众汽车营收微降却亏麻了,利润腰斩暴跌53.5%!

财视传播 浏览 767

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家 浏览 3484

科创板主题基金规模突破三千亿元 “上新”的指数如何参与创新和成长?

金证研 浏览 2624

柳云龙:与初恋结婚,婚后生一女,如今咋样了?

人间无味啊 浏览 2879

京东首款汽车定了!埃安UT迎泼天流量,能否逆天改命?

雷科技 浏览 2757

一家三口被撞身亡案将宣判 家属悔恨当天喊他们来吃饭

极目新闻 浏览 12341

心系球队,梅西一家现身看台观战阿根廷vs委内瑞拉

懂球帝 浏览 2859

10.58 万!零跑造了一台「红米 YU7」

极客公园 浏览 2546

泽连斯基宣布:或购买150架"鹰狮"战斗机 已签意向书

环球网资讯 浏览 7878

女子孕检低风险却生下唐氏儿 险企拒赔:只赔"标准型"

鲁中晨报 浏览 8314

苹果被曝开发类ChatGPT应用!专为训练新Siri打造

智东西 浏览 3274

或搭载激光雷达 长城硬派越野车谍照曝光

车质网 浏览 1975

不满国安糟糕战绩,工体北看台球迷连唱三首歌表达抗议

懂球帝 浏览 2636

李湘王岳伦合体露面被偶遇,离婚后仍相处融洽,两人身材很富态

扒虾侃娱 浏览 2662

朱孝天回应阿信感谢,自曝没再收到邀约

萌神木木 浏览 1710

特朗普称"美国拥有无人知晓的武器" 克宫回应

环球网资讯 浏览 1597

4年半亏了165亿,百亿基金经理被告上法庭

深蓝财经 浏览 1776

打通置换堵点!上海放大招:政府启动二手房收购

国际金融报 浏览 1449

冯仑:兄弟管公司,女朋友管章子,「江湖人」的企业往往都死得快

冯仑风马牛 浏览 2743

特朗普遇到"反关税"广告:再给加拿大加10%关税

红星新闻 浏览 8216
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1