1.本站提供的语音模型可将声音(干声)转换为模型训练的音色;任何发布到视频平台的基于本站模型创作的视频,都必须要在简介明确指明用于变声转换的输入源歌声、音频
2.可在线体验的模型均已挂载于魔搭社区,可通过页内“在线体验”快速跳转开始使用。语音生成速度受转换声音的音频长度和魔搭社区服务器分配的计算资源限制,生成会比较慢,请耐心等待!
3.在线体验语音转语音(翻唱)功能需自行准备干声文件。特别提示:目前本站模型训练使用的训练集大多都缺乏高音及低音的素材,因此模型或多或少都会有不擅长高音或低音的情况,表现方式为转换出来的声音是哑音,遇此情况可考虑混合使用其他能适应输入源音高的模型组合使用合唱。如音频转换报错可能是魔搭平台创空间的核心库出错或未正确部署,有6G以上支持CUDA的NVIDIA显卡,建议搭建在本地搭建环境使用。
4.在线体验文字转语音功能时如选择语言(即内置TTS模型)为Auto,生成的效果不太好时,请自行调整内置TTS语言模型至你认为最好的一个。
5.本项目内提供的模型版本与训练步数(Step)的比例关系是1:10000,例如:v1.0=10000step、v6.1=61000step。
2024.7.19
考虑到本站提供的本地部署包可能需要一定的外网条件以及Python基础,适合想要自己捣鼓的人使用,如果你仅是想使用模型翻唱,这里更推荐B站up主羽毛布団的懒人整合包(点我跳转)。
(只翻唱推理,不训练模型,可以使用CPU进行推理,只是会有点慢)