OpenAI藏了1年多的技术正式公开，15秒素材克隆声音，HeyGen也在用-淘娜娜副业社

关注前沿科技克雷西发自凹非寺

量子位 | 公众号

雪藏的新产品——语音合成引擎Voice ，终于被正式揭幕。

有了它，只需15秒的语音样本，就能克隆出一个人的声音，而且还能跨越语言！

APP版中的语音对话功能，也正是由这项技术所驱动。

效果如何？先来听段DEMO：

Salt also makes sure we stay which means there is water in our body for it to .

盐分也可以保持人体内的水分，确保其满足正常功能的需要。

而通告显示，他们在2022年底就已经开发出了这项技术，但出于安全考虑一直没有正式发布。

这次，终于官宣了Voice ，并展示了小规模测试中的几个应用案例。

比如，一家非营利医疗机构就利用这项技术，为一名年轻的病人恢复了她的声音。

另外值得一提的是，去年爆火的视频翻译软件，采用的语音引擎也正是Voice 。

那么，这次还展现了哪些效果，下面就来一睹为快。

用AI帮助病患恢复声音

首先是利用基础的语音合成能力，为儿童等不具备文字阅读能力的群体提供阅读辅助。

比如一家儿童教育技术公司，就一直在使用Voice 来给编写好的画外音内容配音。

DEMO中生成的大段内容，都是基于这样一段15秒的样本：

然后，就可以合成相同音色的长段语音：

再来看看中用到的的语音翻译技术，原始素材是一段英语的音频：

它被用原始的音色，翻译成了普通话、法语、德语等多种语言。

忽略译文的质量，只听声音，中文的效果是这样的：

音色保持的还算不错，不过腔调很明显一听就是外国人在说中文。

至于这到底是个bug还是个，就见仁见智了（手动狗头）。

此外，一款名为Livox的残障人士辅助应用，也利用Voice 为不能说话的残障人士“发出声音”——

在有了Voice 之后，TA们可以选择专属的真人音色，而不再是机械感明显的合成音，并且在各种语言之间都能保持音色的一致性。

不只是帮助残障人士拥有自己的声音，Voice 还可以为因疾病导致声音发生在重大改变的人群，恢复患病之前声音，只要有以前的声音样本就能实现。

一名年轻的患者因罹患血管性脑肿瘤，失去了流利讲话的能力，说话变成了这样：

医生从她所在学校录制的视频中提取到了她患病前的声音作为样本，在Voice 的帮助下为她恢复了此前的音色。

此次发布的案例，特别是为不便人士提供帮助的场景受到了不少好评，但也有网友对这项技术的滥用表达了担忧。

———END———
限时特惠： 本站每日持续更新海量各大内部创业教程，永久会员只需109元，全站资源免费下载点击查看详情
站长微信： nanadh666

声明：1、本内容转载于网络，版权归原作者所有！2、本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。3、本内容若侵犯到你的版权利益，请联系我们，会尽快给予删除处理！

OpenAI藏了1年多的技术正式公开，15秒素材克隆声音，HeyGen也在用