关闭广告

小米开源语音大模型Xiaomi-MiMo-Audio,对话自然度达拟人水准

IT之家3486人阅读

IT之家 9 月 19 日消息,小米今天宣布开源首个原生端到端语音大模型 Xiaomi-MiMo-Audio,首次在语音领域实现基于 ICL 的少样本泛化

据小米介绍,五年前 GPT-3 首次展示了通过自回归语言模型 + 大规模无标注数据训练,获得 In-Context Learning(ICL,上下文学习)能力,而在语音领域,现有的大模型仍严重依赖大规模标注数据难以适应新任务达到类人智能

而 Xiaomi-MiMo-Audio 模型打破了这种瓶颈,它基于创新预训练架构和上亿小时训练数据,在智商、情商、表现力与安全性在内的跨模态对齐能力均有提升,在自然度、情感表达和交互适配方面呈现出拟人化水准

这款模型的具体创新点如下:

  • 首次证明把语音无损压缩预训练 Scaling 至 1 亿小时可以“涌现”出跨任务的泛化性,表现为 Few-Shot Learning 能力。

阅读全文
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

买手机前必看!安兔兔1月性能排行更新:第一名甩开垫底近40万分

快科技 浏览 1503

宝刀不老,34岁加纳老将乔丹-阿尤献7球7助攻率队直通世界杯

懂球帝 浏览 2931

小米米家空调迎“智能诊断”功能,可联网远程识别设备异常状态

IT之家 浏览 2664

杜克大学开创新型物联网控制语言,手机就能对话所有智能设备

科技行者 浏览 2685

一车三动力:五菱星光730电/油/插混动力配置公布,10月15日预售

IT之家 浏览 2928

76岁欢喜哥去世!众星悼念

查尔菲的笔记 浏览 2624

29.2万辆!难怪比亚迪9月跟“疯了”一样,原来是给这几天憋大招

小李车评李建红 浏览 2916

市值26亿豪掷32亿跨界“钠电”,环保企业“同兴科技”胜算几何?

时代周报 浏览 2042

甲骨文盘中涨超6%,华尔街"抄底派"料股价有望反弹90%

华尔街见闻官方 浏览 2264

石药集团185亿美元合作背后

YOUNG财经 浏览 1393

2.7亿买下“徐翔家族”实控的宁波中百1888万股,拍卖刚结束股价就闪崩

红星资本局 浏览 2785

"巴铁"越打越猛阿富汗塔利班致电北京 中方斩钉截铁

健身狂人 浏览 88869

土拍市场延续“缩量提质”百强房企今年前两月拿地超950亿元

商业观察杂志社 浏览 936

杭州男子家中一斤黄金消失找了两天后报警 结局太意外

环球网资讯 浏览 32698

天马推出高端 OLED 技术品牌“天马天工屏”

IT之家 浏览 3554

女警带儿子逛街遇行凶 徒手夺刀面部受伤差点伤到动脉

大象新闻 浏览 6331

维斯塔潘:赛车的驾驶感受很糟糕,不指望在周六雨战有明显提升

懂球帝 浏览 2550

女孩引产遭拒生女婴被医生"送人" 抱养方称捡弃婴露馅

澎湃新闻 浏览 9210

阿维塔汽车12月销量10470辆,2025全年突破12万辆

IT之家 浏览 1830

以总理办公室:已确定加沙“和平委员会”总干事人选

国际在线 浏览 1802

上赛季至今五大联赛仅6人直接参与40球+:凯恩第1,青木在列

懂球帝 浏览 2044
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1