关闭广告

IDEA研究院发布LEMAS:首个15万小时多语言语音数据集

科技行者1683人阅读


科技发展到今天,人工智能已经能够模仿人类的声音说话了。然而,如果你曾经尝试过让AI说其他语言,比如让一个英语AI说中文,你可能会发现它的口音怪异,发音不准,甚至完全听不懂在说什么。这就像是一个只会说英语的人硬要说中文,结果说得让人啼笑皆非。这背后的根本问题是什么呢?缺乏高质量的多语言语音数据。

由国际数字经济研究院(IDEA)主导的研究团队最近发表了一项突破性成果,这项研究发表于2025年1月的arXiv预印本服务器上,论文编号为arXiv:2601.04233v1。感兴趣的读者可以通过这个编号查询完整论文。研究团队构建了一个名为LEMAS的庞大语音数据集,包含超过15万小时的多语言语音数据,覆盖10种主要语言,并且每个词都有精确的时间戳标注。基于这个数据集,他们还开发了两个强大的AI模型:LEMAS-TTS和LEMAS-Edit,前者专门负责语音合成,后者专门负责语音编辑。

为了理解这项研究的重要性,我们可以把语音AI比作一位多语言播音员。传统的播音员要想掌握多种语言,需要大量的训练素材和精确的指导。同样,AI要想说好多种语言,也需要海量的高质量语音数据作为"教材"。但现有的多语言语音数据存在许多问题:要么

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

重马一跑者倒地去世 跑友:他在跑圈被称为"破三大神"

红星新闻 浏览 11394

特朗普:俄乌接近达成协议 就顿巴斯问题尚未达成一致

红星新闻 浏览 23306

女演员被前夫指责害死公公 本人称愿接受刑事立案调查

极目新闻 浏览 26086

“大空头”11亿空单瞄准英伟达和Palantir,AI泡沫真的来了吗?

郭施亮 浏览 2563

哈格里夫斯:希望拉什福德能回曼联,俱乐部完全可以用得上他

懂球帝 浏览 1755

何晴病重照流出,儿子跟前夫生活病中无亲属照顾,人生末路显凄凉

不八卦会死星人 浏览 2096

上海业主十一出游后推开家门懵了 精装房成"化粪池"

环球网资讯 浏览 2812

《阿凡达3》不及预期,3个小时全是野人乱跑,排片降了不被看好

萌神木木 浏览 1974

售出39000台 小米汽车公布2026年1月销量

网易汽车 浏览 1499

零跑D19豪华旗舰SUV完成申报,预计4月上市交付

IT之家 浏览 1670

胜率大降!若特朗普“对等关税”被推翻,市场会如何反应?

华尔街见闻官方 浏览 2424

入秋第一件打底衫!你买这3件,太好看了!

Yuki女人故事 浏览 2797

国家放大招了,一口气画了10个圈!

米筐投资 浏览 2998

马斯克宣布脑机接口将量产,特斯拉自动驾驶挑战引发安全质疑

红星新闻 浏览 1921

被控诉家暴女儿 "疯狂英语"李阳诉前妻案一审胜诉

红星新闻 浏览 4363

高云翔深夜在天津街头淋雪,边走边笑

观察鉴娱 浏览 1655

9月重夺销冠,这次上汽赢在内功

网易汽车 浏览 2895

巴黎人报:出于保险,恩里克半场就换下了努诺-门德斯

懂球帝 浏览 2270

整车34.98万元/租电24.18万元,蔚来新ES6 30万台纪念版上市

IT之家 浏览 2212

留几手为闫学晶叫屈?称网友自卑敏感

小徐讲八卦 浏览 1749

“这条裙子”才是今年的顶流,怎么搭都时髦

LinkFashion 浏览 2897
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-1