关闭广告

香港科技大学团队发现形式化验证如何让AI推理更聪明

科技行者1459人阅读


这是一个关于人工智能如何学会更好地思考的故事。想象一下,你在教一个聪明但有点"散漫"的孩子做数学题。这个孩子通常能猜对答案,但他的推理过程常常有漏洞——他会说"因为看起来对所以就对了",而不是真正理解为什么。如今,来自香港科技大学、上海人工智能实验室、浙江大学和香港浸会大学的研究团队发现了一个巧妙的办法,让这个"散漫的孩子"学会了像数学家一样严谨地思考。这项研究发表于2026年1月,论文编号为arXiv:2601.22642。

这个故事的核心很有趣:当今最强大的语言模型,比如ChatGPT和Claude,在处理复杂推理问题时,常常会犯一个致命的错误。它们会生成看似合理但逻辑上存在严重漏洞的答案。研究人员的发现更是令人担忧——即使在最终答案是对的情况下,推理过程中有39.3%的步骤在形式化验证中被"驳回"了。而当答案错误时,这个比例甚至高达52.4%。这就像一个学生虽然最后得到了正确答案,但他的计算过程完全是错的——纯粹是靠运气或者模式识别碰巧得对了。

研究团队的创新之处在于,他们不是简单地让AI生成答案就完事,而是在推理的每一步都加入了一个"严厉的数学老师"——形式化验证系统。这个"老师"会实时检查每

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

AI会取代考古学家吗?在这场沙龙中窥见人工智能对文保利用的影响

封面新闻 浏览 2773

以专家:以色列唯一正确选择 就是100%服从特朗普安排

中国新闻周刊 浏览 10824

造议员假丑闻、给假新闻链接,谷歌 Gemma AI模型遭投诉后下架

IT之家 浏览 2464

一个时代的回调:普拉多限时官降,是国产越野车的胜利注脚

燃擎频道 浏览 1547

锡安复出生涯首次替补18+6 鹈鹕送公牛9战第8败吉迪11+7+5

醉卧浮生 浏览 1994

记者:海港抵达武里南,莱昂纳多、加布、李帅、刘若钒伤缺

懂球帝 浏览 2555

连续两场地区联赛弃赛后,葡老牌球队博阿维斯塔面临解散风险

懂球帝 浏览 2748

土耳其紧急喊话俄乌:别碰能源设施!

观察者网 浏览 2213

VC为何关心比邻星之旅?滴水湖畔“仰望星空”,上海这样求解未来

文汇报 浏览 1973

俄在日本海演习击沉假想敌潜艇

参考消息网 浏览 2554

俄称在红军城打击被围困的乌军 乌称击退俄军进攻

环球网资讯 浏览 2540

昂跑藏了一张底牌

虎嗅APP 浏览 1925

AI竞赛白热化!全球资本开支飙升,中国快速追赶

第一财经资讯 浏览 2653

WTT重庆冠军赛:莫雷加德3-0横扫丹麦猛将,即将迎战国乒温瑞博

乒谈 浏览 749

Altman放话:2028年,超级智能将超越人类

钛媒体APP 浏览 994

芦哲:美国CPI势弱,联储10月降息几无悬念

首席经济学家论坛 浏览 2730

98版沙僧刘大刚去世,最后露面曝光

科学发掘 浏览 2462

生于1996年女子连任董事长 去年薪酬92万元

每日经济新闻 浏览 7868

新官上任三把火,特朗普的第一把火会烧给谁?

浏览 25336

华为多款手机通过星闪认证,测试集含L2HC编解码等测试

IT之家 浏览 1512

3岁男孩跌入炭堆全身烧伤85%尚未脱险 家人发声

封面新闻 浏览 8205
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1