微软研究人员在研究预览中介绍了VASA-1,这是一种AI模型,它从人像照片和音频文件中创建一个逼真的有声人脸视频(Ryan Morrison/Tom’s Guide)

令人印象深刻的口型同步–来自微软的新AI研究论文承诺未来你可以上传照片。

查看原文