关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家1641人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

《四喜》的妈圈生存指南:没有全福,只有幸存

仙女事件簿 浏览 606

梁朝伟谈《寂静的朋友》,它“改变了我与自然的关系”

幕味儿 浏览 684

消息称LPDDR5X内存价格持续飙升,涨幅可抵2亿像素潜望镜

IT之家 浏览 794

媒体:美军犯致命错误 误把敌机当成自家的致重大伤亡

环球时报新闻 浏览 77984

CEO们不再为了流量吹牛,挺好的

汽车公社 浏览 339

媒体人:前广厦外援卡明斯加盟周琦老东家东南墨尔本凤凰

直播吧 浏览 14662

百度再战高德,还拉来了两大“帮手”

螺旋实验室 浏览 984

京东把榜一大哥整不会了

老斯基财经 浏览 793

拆解助贷“六小强”三季报

北京商报 浏览 248

起底视觉中国:上百名员工撬动50万名摄影师,一张图片平台抽水七八成

时代财经 浏览 14135

媒体:拜登说漏了?美国有毁灭台湾计划?

环球网资讯 浏览 19122

替补都很强!布歇7中7砍17分9板 施罗德13分3板4助 特伦特14分

直播吧 浏览 12821

阿门:我之前一直是詹姆斯、威少和沃尔球迷,后来我喜欢隆多

懂球帝 浏览 172

一天4瓜!个个离谱

阿纂看事 浏览 806

国乒女双夺冠女单却陷泥沼:8强仅杨屹韵1人 日乒4将围剿张本领衔

颜小白的篮球梦 浏览 840

特朗普第5次给莫迪打电话莫迪终于接了:75岁生日快乐

第一财经资讯 浏览 11786

河南田地积水玉米发霉 农民:夏天求的雨下在了秋天

经济观察报 浏览 6680

用热爱赚钱,其实不难

虎嗅APP 浏览 14862

美国一座弹药厂突发爆炸:1人当场身亡

环球网资讯 浏览 15936

专家:高市早苗跟台湾关系较密切 会让大陆比较担忧

澎湃新闻 浏览 4004

重庆一大学生发帖称老师"刻薄" 老师不接受道歉将起诉

封面新闻 浏览 6737
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1