关闭广告

Claude Opus 4.5来了!单次生成打造《我的世界》,还破解高难度Agent测评

智东西368人阅读

智东西
作者 陈骏达
编辑 李水青

智东西11月25日报道,今天,Anthropic发布了自家的旗舰编程模型Claude Opus 4.5。Anthropic称,这是全球范围内在编程、agents和计算机使用方面最强大的模型。

在真实世界软件工程测试SWE-bench Verified中,Claude Opus 4.5成为首款得分超过80%的AI模型,不仅领先于自家的Claude Sonnet 4.5,还超过了上周发布的Gemini 3 Pro和GPT-5.1 Codex-Max。


Anthropic还把该公司面试人类工程师的高难度居

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

31岁女护士提分手遭男友割喉 生前日记称像活在地狱中

中国新闻周刊 浏览 6402

无视美国拉拢,越南硬气十足,没让中方失望

浏览 10677

新秀墙?林葳近四战投篮命中率为32% 三分仅为22中4

直播吧 浏览 19106

日媒放风:日央行考虑3月放弃YCC,结束负利率

华尔街见闻官方 浏览 12156

B站举办2023百大UP主盛典,“棋手战鹰”获直播年度黑马奖

网易科技报道 浏览 12966

边境移民矛盾持续发酵 美国会发生“内战”吗

齐鲁壹点 浏览 12705

吉利ICON巧克力心动紫上市!网友:销量稳了

汽车网评 浏览 712

李书福狠不起来,吉利的现在和未来,都需要燃油车铺路

字母榜 浏览 14064

京东卖车翻车:汽车电商为何屡战屡败?

天天汽车 浏览 259

记者实测 多地办理电话卡需提供无犯罪证明和银行流水

澎湃新闻 浏览 6713

谷歌AI实现类人判断解决系统偏见问题

科技行者 浏览 692

公募基金业绩比较基准迎规范,证监会、中基协公开征求意见

华夏时报 浏览 714

湖人已经给里夫斯4年5200万美元顶薪报价,他将等待别队给出更高价

OnFire 浏览 15550

49岁吴彦祖与妻子闲谈被偶遇!两人观展状态佳

笑猫说说 浏览 14740

独家对话CEO,解密华强北Vision Pro,最难“山寨”的苹果产品!

智东西 浏览 12415

不理多国"最后警告" 胡塞武装再在红海引爆炸弹

环球时报国际 浏览 12809

"90后"王兴兴:小学时想当科学家 同学一句话启发了我

中国新闻周刊 浏览 6080

黄仁勋亲赴台积电“讨要更多芯片” 回应存储短缺、涨价等问题

财联社 浏览 585

请准备好钱!成都车展重磅豪华SUV都在这

车市红点 浏览 20247

美舰过航台湾海峡 解放军全程跟踪监视

东部战区 浏览 11957

证监会乘胜追击!开年对23家会计所处罚,近八成罚单指向年报审计

资本百科 浏览 12415
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1