,微软日前推出了一款名为 NaturalSpeech2 的语音模型,该模型采用“潜在扩散”式设计,在零样本语音合成层面效果出众,微软宣称该模型提供了“商业级”的语音 / 歌唱解决方案,能够给予用户高质量、多样化的语音合成体验。
微软对 NaturalSpeech2 进行了一系列演示,展示了其在零样本情况下生成具有不同说话人身份、韵律和风格的语音的能力。
据悉,与传统的语音转文字系统不同,微软的 NaturalSpeech2 使用“连续向量”取代“离散标记”来表示语音,从而生成更完整的语音片段,不会产生“缺乏感情”的“棒读(一字一顿地讲话)”现象。
实验结果表明,NaturalSpeech2 在零样本条件下生成的语音与语音提示和真实语音的韵律近乎一致,并且在 LibriTTS 和 VCTK 测试集上的自然度与真人语音难以区分。
该项目的论文目前已经发布于 GitHub 中,感兴趣的IT之家小伙伴们可以点此访问。
广告声明:文内含有的对外跳转链接,用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
7月27日,2023ChinaJoy“CDEC高峰论坛”在上海开幕,邀请全球产业精英共赴大会,助力我国互动娱乐创新融合发展及优秀文化全球传播
2021年以来,中铁十一局二公司先后荣获全国五一劳动奖状、全国工程建设AAA级信用评价企业,连续多年完成施工产值和经营承揽分别超过100亿元
农发行衡水分行以三抓三促落实案防长效管理机制,推进案防工作向纵深开展,为推进高质量发展保驾护航。抓思想促认识。开展一把手讲案防活动,组织员工
,据韩媒businesskorea报道,韩国最大电信运营商SK电讯在首尔华克山庄酒店举办“全球电信AI联盟CEO峰会”。 会上,SK电讯、
7月21日,人保财险河北张家口市分公司使用人保支付数字人民币通道实现了学平险保费收缴,标志着人保支付数字人民币在应用中迈出关键一步。 据了
日前,农发行遂宁分行向遂宁嘉实贸易有限责任公司投放该行首笔小微智贷贷款58万元,用于支持企业收购棉花。 据了解,作为农发行首个自主研发的智
截至7月27日,由中铁广州局负责施工的西康高铁林家山隧道二次衬砌施工累计完成2016.8米,继一工区二次衬砌施工突破5000米大关后,单隧实
全球智能手机市场已度过快速增长阶段,产品结构开始分化。其中,中低端产品需求下滑严重,高端产品市场表现更为强劲。此外,人工智能技术的快速发展也
更新肥胖药物tirzepatide3期数据:可减轻体重26%) 智通财经APP获悉,礼来在周四发布了用于治疗肥胖症的药物tirzepati
7月27日,大众汽车集团披露了2023年中期业绩。 今年上半年,得益于销量的持续复苏以及稳健的产品组合和定价策略,大众集团的总收入达到15
先驱网--综合性的生活资讯平台
邮箱:hchchc0324@163.com