,在 2023I / O 开发者大会上,谷歌宣布正在开发一项名为 Universal Translator 的实验技术。
顾名思义,该工具旨在将视频从一种语言翻译成另一种语言,同时保留整体基调和氛围。这意味着该技术不仅可以将音频从一种语言翻译成另一种语言,还可以模仿说话者的声音、语气和面部表情,人物说话视频会根据目标语言的发音同步改变口型。
如上图所示,Universal Translator 首先检测单词并进行翻译。然后,它会检查说话者的语气以及他们强调的内容。结合这两个方面后,它会生成目标语言的语音。最后,它会根据 AI 生成的语音的发音同步视频中说话者的口型。
考虑到此工具可能被滥用来创建虚假视频,谷歌表示将限制对 Universal Translator 的访问。因此,只有谷歌授权合作伙伴才能将其用于建设性项目,而普通用户无法使用。