AI新工具
banner

Stable Audio Open


介绍:

Stable Audio Open是一个开源的文本到音频生成模型,可生成长达47秒的音频样本和音效。









Stable Audio Open

Stable Audio Open 是由Stability AI发布的一款开源模型,专门用于生成短音频样本和音效。这个模型能够根据文本提示生成最高47秒的音频数据,适用于创建鼓点、乐器片段、环境音效、拟音录音和其他音乐制作元素。Stable Audio Open 主要面向声音设计师、音乐人和创意社区,允许用户在自定义音频数据上进行微调,从而生成新的音频样本。

与Stable Audio的商业版本不同,Stable Audio Open专注于音频样本和声音效果生成,而不是完整的歌曲或旋律。商业版能够生成高质量、结构完整的音乐片段,并支持高级功能如音频到音频生成和多部分音乐创作。而Open版本则展示了生成音频设计的潜力,同时强调与创意社区共同开发和负责的发展理念。

Stable Audio Open模型的权重可以在Hugging Face平台上获取,鼓励声音设计师、音乐人、开发者和音频爱好者下载并探索其功能。同时,Stability AI也希望在开放和负责任的音频生成能力方面继续进行研究和开发,并与创意社区携手合作。

模型地址:https://huggingface.co/stabilityai/stable-audio-open-1.0 github:https://github.com/Stability-AI/stable-audio-tools

可关注我们的公众号:每天AI新工具

广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:1752338621