关闭广告

杜克大学团队重磅发现:AI语音助手为何在复杂思考时"掉线"?

科技行者2728人阅读


这项由杜克大学林月倩、胡正绵领导,联合Adobe公司研究团队完成的重要研究发表于2025年,论文编号为arXiv:2509.26542v1,有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队首次系统性地揭示了一个令人困惑的现象:当我们用语音与AI助手交流时,它们在处理复杂问题时的表现会大幅下降,这种现象被称为"语音推理鸿沟"。

当你向Siri询问简单的天气信息时,它能迅速准确地回答你。但如果你让它解一道复杂的数学题,或者分析一个需要多步推理的问题,你会发现它的表现远不如你通过文字输入同样问题时的效果。这种差异并非偶然,而是当前语音AI系统普遍存在的根本性挑战。

研究团队通过构建一个名为VERA的全新评测体系,对12个主流语音AI系统进行了深入测试。结果令人震惊:在复杂数学推理任务中,顶级文字AI模型GPT-5能达到74.8%的准确率,而其语音版本GPT-realtime却只有6.1%的准确率,两者相差高达68.7个百分点。这种差距并非个例,在所有需要深度思考的任务中都普遍存在。

这个发现的重要性不言而喻。在人工智能快速发展的今天,语音交互已经成为我们与AI系统沟

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

四足机器人首次同时「思考+走路」,北大提出链式推理MobileVLA-R1

新智元 浏览 2168

洪都拉斯3-0大胜海地,奎奥托建功,安东尼-洛萨诺破门

懂球帝 浏览 2808

官方:西汉姆联宣布波特下课

体坛周报 浏览 3143

携程涉嫌垄断被立案调查 尾盘跳水大跌超6%

Daily每日财报 浏览 1689

美媒:美对伊朗行动选项"远超传统空袭"

新华社 浏览 1634

为什么最好全款买蔚来ES8,也不要贷款分期买?套路实在太多了

大志聊车 浏览 1813

印度无人机成批击落,以色列武器神话翻车

浏览 5938

天翎科旗舰飞行器L600真机下线,累计获得近千架意向订单|最前线

36氪 浏览 2572

外观大幅调整 疑似红旗H5纯电版谍照曝光

车质网 浏览 2167

伊姐周日热推:电视剧《凤凰台上》;电视剧《亲爱的X》......

伊周潮流 浏览 1973

多给2分钟来背锅?大帝25分钟20+6丢绝杀 马克西才该为失利担责

颜小白的篮球梦 浏览 2674

预测票房26亿!除了中文配音拉胯,《疯狂动物城2》没任何毛病

最爱酷影视 浏览 2299

碰瓷营销还是真有实力 创维汽车的“生存者游戏”

网易汽车 浏览 581

中国“智”造闪耀国际舞台,“维度I型”无人机成功出海

红星新闻 浏览 2935

特朗普失去耐心 给泽连斯基下最后通牒

华西都市报 浏览 7177

官媒揭开70岁潘虹的真实现状,董卿说的一点没错

手工制作阿歼 浏览 2134

文联春晚录制现场好真实!大咖太多没人惯着

萌神木木 浏览 1508

潘江:大家的思想包袱还是太重,希望奈特能保持这样的状态

懂球帝 浏览 1733

博士学历女厅官袭燕被双开:违规收受礼金、消费卡

红星新闻 浏览 7164

媒体:河南农民苦 夏天大旱中救活的玉米现在都泡烂了

南风窗 浏览 8277

特朗普突然中止与加拿大贸易谈判 加元汇率直线跳水

每日经济新闻 浏览 8669
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1