XTTSv2:语音克隆最佳开源方案
作者: 人工智能技术与时代人物风云 来源: 人工智能技术与时代人物风云
项目简介
HeyGen实现流程中的语音克隆,现在有最佳开源方案了:XTTS v2,单样本即可克隆语音。现在已经能实现:让一个明星的采访视频,变成他讲述任意小故事(内容可以GPT编)的视频,声音是他的声音,嘴型也能对上。
🐸TTS 是一个用于高级文本转语音生成的库。
🚀 超过 1100 种语言的预训练模型。
🛠️ 用于以任何语言训练新模型和微调现有模型的工具。
📚 用于数据集分析和管理的实用程序。
🥇 TTS 性能
带下划线的“TTS*”和“Judy*”是未开源发布的内部🐸TTS 模型。他们来这里是为了展示潜力。以点为前缀的模型(.Jofish、.Abe 和 .Janice)是真实的人声。
特征
-
用于 Text2Speech 任务的高性能深度学习模型。
-
Text2Spec 模型(Tacotron、Tacotron2、Glow-TTS、SpeedySpeech)。
-
扬声器编码器可有效计算扬声器嵌入。
-
声码器模型(MelGAN、Multiband-MelGAN、GAN-TTS、ParallelWaveGAN、WaveGrad、WaveRNN)
-
-
快速高效的模型训练。
-
终端和 Tensorboard 上的详细训练日志。
-
支持多扬声器 TTS。
-
高效、灵活、轻量但功能齐全 Trainer API 。
-
已发布且可供使用的模型。
-
用于在 dataset_analysis 下整理 Text2Speech 数据集的工具。
-
使用和测试模型的实用程序。
-
模块化(但不是太多)代码库可以轻松实现新想法。
安装
🐸TTS 在 Ubuntu 18.04 上测试,Python >= 3.9, < 3.12..
如果您只对使用已发布的 🐸TTS 模型合成语音感兴趣,从 PyPI 安装是最简单的选择。
pip install TTS
如果您计划编码或训练模型,请克隆 🐸TTS 并在本地安装。
git clone https://github.com/coqui-ai/TTS
pip install -e .[all,dev,notebooks] # Select the relevant extras
如果您使用的是 Ubuntu (Debian),您还可以运行以下命令进行安装。
$ make system-deps # intended to be used on Ubuntu (Debian). Let us know if you have a different OS.
$ make install
如果您使用的是 Windows,👑@GuyPaddock 在此编写了安装说明。
Docker 镜像
您还可以尝试 TTS,无需安装 docker 镜像。只需运行以下命令,您无需安装即可运行 TTS。
docker run --rm -it -p 5002:5002 --entrypoint /bin/bash ghcr.io/coqui-ai/tts-cpu
python3 TTS/server/server.py --list_models #To get the list of available models
python3 TTS/server/server.py --model_name tts_models/en/vctk/vits # To start a server
然后,您可以在此处享受 TTS 服务器有关 docker 映像(例如 GPU 支持)的更多详细信息可以在此处找到
项目链接
https://github.com/coqui-ai/tts
XTTS v2在线体验:https://huggingface.co/spaces/coqui/xtts
关注「GitHubStore 」公众号
扫一扫以下微信
1 加入技术交流群,备注「开发语言-城市-昵称 」
更多AI工具,参考Github-AiBard123,国内AiBard123