关闭广告

Claude Opus 4.5来了!单次生成打造《我的世界》,还破解高难度Agent测评

智东西2331人阅读

智东西
作者 陈骏达
编辑 李水青

智东西11月25日报道,今天,Anthropic发布了自家的旗舰编程模型Claude Opus 4.5。Anthropic称,这是全球范围内在编程、agents和计算机使用方面最强大的模型。

在真实世界软件工程测试SWE-bench Verified中,Claude Opus 4.5成为首款得分超过80%的AI模型,不仅领先于自家的Claude Sonnet 4.5,还超过了上周发布的Gemini 3 Pro和GPT-5.1 Codex-Max。


Anthropic还把该公司面试人类工程师的高难度居

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

热议中超:恶心国安放水,西海岸和英博值得尊重

懂球帝 浏览 2731

九旬李明启谈到容嬷嬷为自己发声

蜜桔娱乐 浏览 2600

辛纳重返世界第一无悬念?网友点出阿利西姆难阻意大利人夺冠原因

网球之家 浏览 2600

马杜罗在纽约法院首次出庭,对贩毒等指控表示"不认罪"

华尔街见闻官方 浏览 1795

松弛感穿搭太适合秋冬了,减龄又好看

LinkFashion 浏览 2508

纵贯一整年的精彩:柏林电影节佳作在中国

幕味儿 浏览 1978

夸克AI眼镜开售,88VIP叠加9折消费券,最低3329元

海外网 浏览 2856

徐正源:以饱满斗志迎接挑战 会对阵容进行调整

体坛周报 浏览 2901

黄金、白银突然暴跌!发生了什么?

中国品牌 浏览 2207

伊姐周六热推:电视剧《亦舞之城》;电视剧《时差一万公里》......

伊周潮流 浏览 2187

朱媛媛遗作《小城大事》定档1月10日

阿淫记录生活日常 浏览 1693

印度总统乘坐“阵风”战斗机进行飞行体验

环球网资讯 浏览 2598

豆瓣逆天9.6,世间再无如此大师云集的神作!

幕味儿 浏览 1949

媒体:中国该如何在军事部署上经营台湾 如今值得思考

新民周刊 浏览 7003

农村危房翻建审批咋这么难?人民日报记者实地调查

上观新闻 浏览 2039

全新奥迪A6L实车:外观大变样轴距超3米,带智能辅助驾驶小蓝灯?

Nice好车 浏览 2911

小米研究院推出AI视频理解:让机器像人一样"回看"思考视频内容

科技行者 浏览 1621

TA:维尼修斯认为自己在球队整体表现不佳的情况下被区别对待

懂球帝 浏览 2055

真爱大牌返场|| 一上线就被抢空的牌子,这次居然100+就能拥有

黎贝卡的异想世界 浏览 2514

不变应万变!曼城连续3场首发不变,为瓜帅执教以来第三次

直播吧 浏览 3446

落地为王:谁在用AI引领百亿价值跃迁?

虎嗅APP 浏览 2251
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1