关闭广告

上海AI实验室推出ATLAS:让AI在科学推理中"败下阵来"的超级考场

科技行者1682人阅读


这项由上海AI实验室领导的研究于2024年11月发表在arXiv预印本平台,论文编号为2511.14366。有兴趣深入了解的读者可以通过该编号查询完整论文。研究团队包括来自复旦大学、北京大学、上海交通大学等25所知名院校的专家学者,他们共同开发了一个名为ATLAS的科学推理评测平台。

当人工智能在各种考试中频频刷新高分记录时,一个有趣的现象出现了:那些曾经被视为"金标准"的测试题目,如今对顶级AI模型来说似乎变得过于简单。就像一个天赋异禀的学生轻松通过了小学考试,但我们却不知道他是否真正具备了解决复杂现实问题的能力。

正是在这样的背景下,上海AI实验室的研究团队决定为AI模型打造一个真正的"地狱级考场"。他们开发的ATLAS平台就像是一个专门设计来让AI"败下阵来"的超级测试场,专门检验AI在科学推理方面的真实能力。这个名字本身就很有意味——ATLAS意为"AGI导向的科学逻辑应用测试平台",寓意着要像古希腊神话中扛起天空的巨人一样,承担起衡量AI真实科学推理能力的重任。

想象一下,如果把现有的AI测试比作小学数学题,那么ATLAS就像是博士入学考试。它不满足于简单的

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

马英九祝贺郑丽文当选:坚守"九二共识" 促进两岸关系

参考消息 浏览 6824

美股半导体板块,集体下跌

第一财经资讯 浏览 1605

eSIM来了,但还在来的路上

北京商报 浏览 2722

哈马斯称以色列未履行停火协议 呼吁美方施压

国际在线 浏览 1958

男生眼中最好看的女生排行榜TOP1

Yuki女人故事 浏览 2772

币圈再度血流成河!比特币6月以来首次跌破10万大关,以太币暴跌10%

华尔街见闻官方 浏览 2487

修杰楷承认逃兵役!曾花钱造出假病历,贾静雯回应称孩子受到惊吓

萌神木木 浏览 2796

60+女性穿搭“高级感”秘诀:4个日常技巧,轻松美出优雅气质

静儿时尚达人 浏览 1664

杨幂视后梦碎了?《生万物》除女主之外全员拿奖

萌神木木 浏览 734

年底盈利即将兑现 蔚来Q3财报公布

网易汽车 浏览 2230

18岁少年鳌太线失联超10天 搜救队再次进山展开搜救

红星新闻 浏览 8118

今年流行的这件“短外套”美爆了,怎么搭都优雅贵气!

LinkFashion 浏览 2046

《数据周报97》:房地产何去何从?参考美日经验

智本社 浏览 1672

罗马诺:斯帕莱蒂已与尤文签约,随后将官宣

懂球帝 浏览 2571

厂房沉降纠纷缠身,熊猫乳品两大募投项目延期

时代周报 浏览 1734

Jacob Elordi 最新电影造型,好像鬼!

下水道男孩 浏览 2683

宋伊人新剧被传谣,是要逼人“剖腹取粉”吗?

麻辣婊 浏览 2407

宁德时代:钠新乘用车动力电池正在与客户推进开发、落地中

IT之家 浏览 2667

借款人伪造公章贷款 煤企"缺席"审理被判背负上亿债务

澎湃新闻 浏览 29037

罗晋唐嫣婚变进入倒计时!?

八卦疯叔 浏览 2669

国投瑞银被起诉背后

时代周报 浏览 1618
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1