作者:宋海燕 肖漪涟

随着人工智能科技的飞速发展,利用人工智能(Artificial Intelligence,简称AI)生成与某个特定自然人的声音极为相似的虚假语音变得越来越容易。这一技术被称为“声音克隆”(Voice Cloning),也称“深度伪造语音”(Deepfake Audio)。常见的声音克隆有两种形式:文本转语音(Text to Speech)及语音转换(Voice Conversion,也称Speech to Speech)。“文本转语音”指利用AI将用户输入的文本转化为与特定自然人声音高度相似的语音。“语音转换”指在说话内容不变的情况下,利用AI学习并模仿特定自然人A的声音(包括音色及韵律),从而将特定自然人B(原本的说话人)的声音替换为特定自然人A(转换后的说话人)的声音。

阅读更多