b站UP主花儿不哭开源的文本到语音、AI音色克隆软件GPT-SoVITS。GPT-SoVITS-WebUI是这个强大的少样本语音转换与语音合成工具的Web用户界面。
下面链接给的是github开源发布地址,如果你是 Windows 用户(已在 win>=10 上测试),可以选择下载整合包,解压后双击 go-webui.bat 即可启动 GPT-SoVITS-WebUI。
视频介绍:https://www.bilibili.com/video/BV12g4y1m7Uw/
功能:
零样本文本到语音(TTS): 输入 5 秒的声音样本,即刻体验文本到语音转换。
少样本 TTS: 仅需 1 分钟的训练数据即可微调模型,提升声音相似度和真实感。
跨语言支持: 支持与训练数据集不同语言的推理,目前支持英语、日语、韩语、粤语和中文。
WebUI 工具: 集成工具包括声音伴奏分离、自动训练集分割、中文自动语音识别(ASR)和文本标注,协助初学者创建训练数据集和 GPT/SoVITS 模型。
数据评估
关于GPT-SoVITS特别声明
本站宅仓库收录的GPT-SoVITS源于网络,不保证外部链接的准确性和完整性,该外部链接的指向,不由宅仓库实际控制,在2024年9月22日 下午1:22收录时,该网页上的内容都属于合规合法,后期网页的内容如出现违规,可以直接联系网站管理员进行删除,宅仓库不承担任何责任。