关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家3482人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

TA:皇马正与苹果合作开发VR项目,但一切处于非常早期的阶段

懂球帝 浏览 2709

10天9涨停!又一超级大妖股彻底爆了

财经锐眼 浏览 2732

车贷“高息高返”被叫停后:提前还贷需排队,有银行违约金比例最高达15%

时代周报 浏览 2645

蔚来"疯狂"招工:办公室挤不下去食堂面试 月薪可达8千

每日经济新闻 浏览 5731

华为,车企通向“百万级”的捷径?

道哥说车 浏览 1961

美军绑架马杜罗"原班人马"全部飞抵欧洲 新目标已浮现

依偎在角落 浏览 7569

再论快船用鲍威尔交换科林斯 后者17场后被甩卖卢指导难辞其咎?

仰卧撑FTUer 浏览 2369

民营航天新年首战告捷:星河动力谷神星一号海上成功发射四星入轨

澎湃新闻 浏览 1666

前三季度海洋生产总值7.9万亿元 同比增长5.6%

央视财经 浏览 2628

记者:U21联赛和U19中青赛合并为U20联赛,只是超龄球员数额不同

懂球帝 浏览 1439

再现巨额压单!A股跳水,官媒给“题材炒作”降温,商业航天跌停潮

看财经show 浏览 1539

埃迪-豪7次面对伯恩茅斯场均积分0.7分,仅比对阵曼城、红军更多

直播吧 浏览 3499

32岁杨紫又“变脸”,皮肤紧致一脸高原红,重回“锦觅”颜值巅峰

温柔娱公子 浏览 3379

磐霖资本迎来收获季:连投6轮的明星企业上市了

投中网 浏览 1687

官方:狼堡签下20岁日本中场盐贝健人;据悉转会费900万欧

懂球帝 浏览 1691

2025自主四强全年销量成绩单出炉

大象新闻 浏览 1763

碰瓷营销还是真有实力 创维汽车的“生存者游戏”

网易汽车 浏览 577

稳定输出,亚历山大22中11砍35分7板6助,三分9中3&11罚10中

懂球帝 浏览 2453

美媒评字母哥五大交易方案 联手文班?加盟湖人?

体坛周报 浏览 2186

直播|| 降温天的居家幸福感,是它们给的

黎贝卡的异想世界 浏览 2584

舒淇,东亚女孩的恨海情天

时尚COSMO 浏览 2083
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1