关闭广告

7B大模型测试成绩超GPT-4!微软新研究解决工具调用难题

智东西11350人阅读


智东西
作者 徐珊
编辑 云鹏

智东西3月11日消息,近日微软和俄亥俄州立大学的研究人员发布论文,提出了一种受到生物启发的可以增强大语言模型使用工具能力的方法,即模拟试错(STE)法,并将其开源。

该方法协调了试错、想象和记忆三个关键机制。具体而言,STE通过大模型的“想象力”来模拟使用工具的一些合理场景,从而尝试适配不同的大模型,随后从新的反馈中,获得反馈不断优化。

ToolBench实验结果显示,STE在上下文学习和微调设置下显著提高了大语言模型的工具学习能力,让Mistral-Instruct-7B实现了46.7%的性能提升,使其成绩超过了GPT-4。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

699元买不了袜子?张雨绮不当言论引争议

新洞察 浏览 17004

官方披露凉山州社保系统窝案:多人在养老险上动手脚

澎湃新闻 浏览 70378

央视春晚美女主持王嘉宁结婚 老公长相曝光

盖饭娱乐官方号 浏览 16888

外观大幅调整 疑似红旗H5纯电版谍照曝光

车质网 浏览 179

拜登智力缺陷引关注,他可能都无法够独立应对记者

趣看热点 浏览 537983

文班亚马新赛季满血回归 马刺是最被低估球队?

体坛周报 浏览 840

终于!华为Mate 60系列有现货了:多个版本均可下单

雷科技 浏览 12344

Stop!这样化妆可是超级显老的!

《瑞丽服饰美容》 浏览 19624

俄军前线攻势迅猛,泽连斯基急访欧洲三国要军援

环球网资讯 浏览 11135

专家:普京释放强烈信号 要将特别军事行动进行到底

看看新闻Knews 浏览 19527

秋天别错过卫衣搭长靴 少女感兼具少年感

巧百搭 浏览 15051

林正英、钱小豪在拍摄《僵尸先生》时,有几场戏是在台湾取景

趣看热点 浏览 28530

预计4月初发布/价格落到30万内 理想L6实车亮相

网易汽车 浏览 12531

Coach与MK成为一家人,两大轻奢集团合并不放弃高端化

第一财经资讯 浏览 14808

苹果将在美停售多款Apple Watch 欧日市场亦存禁售风险 产业链影响几何?

财联社 浏览 13078

哈利波特将拍剧集,原著粉丝表示期待

趣看热点 浏览 25591

林允儿新剧开播,33岁还像刚成团一样甜美

巧百搭 浏览 16238

除了800V,新Model Y还要上7座!

1号车盟 浏览 12904

沿海大省广东再次选择在特殊时间召开全省重要大会

政知新媒体 浏览 80197

除了T恤 夏天也很需要这4款衬衫

日系志Yumi 浏览 16693

美官员谈布林肯访华:并不期待长长的可交付成果清单

环球网资讯 浏览 89657
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1