人心向背网人心向背网

到目前为止,创建最复杂的人工智能语音模型可以模仿人的原声


到目前为止,到目的人Meta已经开发出了最复杂的止创人工智能语音模型。图片来源:英国《每日邮报》网站。建最

科技日报记者 刘霞。复杂

据英国《每日邮报》23日报道,工智脸书母公司元宇宙平台公司(Meta)据说它已经开发出了“最强大的音模原声语音生成人工智能Voicebox”,它可以模仿包括死者在内的模仿任何人的声音。然而,到目的人Meta宣布不会公开其人工智能模型,止创因为它担心这种先进技术会被滥用。建最

Meta深度学习人工智能研究人员在介绍Voicebox时指出,复杂Voicebox采用了“流匹配”方法,工智其性能优于最先进的音模原声生成语音系统。结果表明,模仿Voicebox生成的到目的人人工音频更容易理解,单词错误率为1.9%,低于竞争对手的5.9%。此外,Voicebox生成的音频与真人更相似,速度快了近20倍。

Voicebox在跨语言翻译中的表现优于备受好评的多语言文本语音AI YourTS,平均单词错误率从10.9%降低到5.2%,音频相似度从0.335提高到0.481。

Meta阐述了Voicebox的各种用途,称它可以用来帮助视障人士听到朋友和亲戚的信息,或者允许非母语人士用自己的声音翻译自己的话。Voicebox目前可以说英语、法语、西班牙语、德语、波兰语和葡萄牙语六种语言。

然而,Meta强调,由于潜在的滥用风险,他们不会披露Voicebox模型及其代码。虽然他们认为向人工智能社区开放和共享研究对促进人工智能的发展至关重要,但在开放和责任之间取得正确的平衡也至关重要。

总编辑圈点。

ChatGPT已经诞生半年多了,人们已经深深感受到了人工智能语言模型的力量。对于各种各样的问题,它可以像流一样回答,令人惊叹。想象一下,如果人工智能在回答人类问题时,不仅内容形式与真人相似,而且声音也很难区分真假,用户可能会感到更强烈的影响。后者是语音生成人工智能的目标。然而,正如文章所说,这些强大的技术确实可能被滥用。在人工智能技术不断升级迭代的同时,相关监管和伦理约束也应及时“上路”。

赞(289)
未经允许不得转载:>人心向背网 » 到目前为止,创建最复杂的人工智能语音模型可以模仿人的原声