Stable Diffusion 3 Medium
Stability AI开源了Stable Diffusion 3 Medium模型,这是一个文本到图像生成模型,具有20亿个参数,能够在消费级PC和笔记本电脑以及企业级GPU上高效运行。该模型在图像质量、复杂提示理解和资源效率方面有显著提升,具有Photorealism、Prompt Adherence、Typography等独特特性。模型使用多模态扩散变压器技术,训练数据包括10亿张图像和大量精调数据。可以通过Stability平台上的API和Stable Artisan注册免费试用。
其突出特点包括:
- 高质量和现实感:生成细节丰富、色彩鲜艳和光线逼真的图像,改进了手部和面部图像的细节表现。
- 复杂提示理解:能够解析复杂的提示,包括空间推理、构图元素、动作和风格。
- 文字排版:实现了前所未有的文本质量,减少拼写错误,与更好的字距和字形表现。
- 资源高效:适合标准消费者显卡运行,无需高配置硬件。
- 细调节能力:可以从小数据集中吸收细微的细节,适合定制化应用。
该模型在与NVIDIA和AMD的合作中进一步优化,支持NVIDIA RTX™ GPU和AMD设备。Stable Diffusion 3 Medium在开放性方面还是保持坚守,提供了非商业研究社区许可证和Creator许可证,并鼓励专业人士用于商业目的。对于大规模商业用途,需联系Stability AI获取企业许可。
详细了解和试用可以通过其API、Stable Assistant和Stable Artisan进行,亦提供了为期三天的免费试用。Stability AI承诺继续改进和优化模型,同时保证安全性和可靠性。
模型地址:https://huggingface.co/stabilityai/stable-diffusion-3-medium
广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:1752338621