Parler-TTS Parler-TTS Parler-TTS 是一个轻量级的文本转语音（TTS）模型，能够根据特定发音者的风格（性别、音调、说话风格等）生成高质量且自然的语音。它是由Stability AI与爱丁堡大学的Dan Lyth和Simon King撰写的论文《通过合成注释指导高保真文本转语音的

Parler-TTS

Parler-TTS 是一个轻量级的文本转语音（TTS）模型，能够根据特定发音者的风格（性别、音调、说话风格等）生成高质量且自然的语音。它是由Stability AI与爱丁堡大学的Dan Lyth和Simon King撰写的论文《通过合成注释指导高保真文本转语音的自然语言》中的工作再现。

与其他TTS模型不同，Parler-TTS是完全开源的，所有数据集、预处理、训练代码和权重均公开在一个宽松的许可下发布，方便社区在此基础上进一步开发自己的TTS模型。

主要组成部分包括：

此外，Parler-TTS发布了两个新的版本检查点Parler-TTS Mini v1和Large v1，这些版本经过训练后在语音生成的质量和速度上有进一步提升，并引入了发音者一致性。

社区和开发人员可以通过GitHub库了解更多关于模型的训练方法，并对模型进行微调。

可关注我们的公众号：每天AI新工具

广告：私人定制视频文本提取，字幕翻译制作等，欢迎联系QQ:1752338621