AI新工具继Midjourney后PixVerse也能够保持角色一致性；OpenAI推出Voice Engine可根据文本和15秒音频样本生成自然发音 ✨ 1: PixVerse 能够在保持角色一致性的同时生成多样化场景动态视频的AI工具 PixVerse的强大之处在于其能够在保持角色一致性的基础上，生成带有丰富背景元素和角色动态的视频，大大提高了生成内容的生动性和真实感。无论是换背景、增加动态效果，还是进行创意

AI新工具继Midjourney后PixVerse也能够保持角色一致性；OpenAI推出Voice Engine可根据文本和15秒音频样本生成自然发音

By AiBard123
April 1, 2024 - 2 min read

✨ 1: PixVerse

能够在保持角色一致性的同时生成多样化场景动态视频的AI工具

PixVerse的强大之处在于其能够在保持角色一致性的基础上，生成带有丰富背景元素和角色动态的视频，大大提高了生成内容的生动性和真实感。无论是换背景、增加动态效果，还是进行创意表达，PixVerse都能够帮你轻松实现。

地址：https://app.pixverse.ai/

✨ 2: Suno-API

基于Python和FastAPI构建的非官方API，主要用于生成歌曲、歌词等

Suno-API是一个基于Python和FastAPI构建的非官方API，主要用于生成歌曲、歌词等。这个API的一个亮点在于它具有自动管理token和保持token活跃的功能，这意味着用户无需担心token过期的问题。

地址：https://github.com/SunoAI-API/Suno-API

✨ 3: LLM Twin Course

免费课程，向你展示如何设计、训练和部署一个准备就绪的生产标准的 LLM（大型语言模型）

LLM Twin Course 是一个免费课程，向你展示如何设计、训练和部署一个准备就绪的生产标准的 LLM（大型语言模型）。这个过程涵盖了从数据收集到部署的全套流程，同时教授利用 MLOps 最佳实践，例如实验跟踪器、模型注册表、提示监控和版本控制。

地址：https://github.com/decodingml/llm-twin-course

✨ 4: Voice Engine

OpenAI推出了名为Voice Engine的模型，可根据文本和15秒音频样本生成自然发音

Voice Engine是一个由OpenAI开发的先进技术，它利用文本输入和一个15秒长的音频样本来生成接近原始说话者声音的自然听起来的语音。这项技术能够以情感丰富和逼真的方式复制人声，即使是用很小的模型和简短的音频样本也能达到这一点。Voice Engine的开发始于2022年末，其应用场景广泛，包括为ChatGPT Voice和Read Aloud提供预设语音，并通过文本转语音API服务。

OpenAI当前只进行了小规模预览并尚未广泛发布这项技术，但它旨在分享Voice Engine的潜在用途，并激励社会提高对通过生成模型带来的挑战的抵抗力。这包括鼓励逐步淘汰基于声音的身份验证措施，探索保护个人声音使用的政策，教育公众理解AI技术的能力和限制，以及加速开发和采用跟踪视听内容来源的技术。

地址：https://openai.com/blog/navigating-the-challenges-and-opportunities-of-synthetic-voices

更多AI工具，参考国内AiBard123，Github-AiBard123

可关注我们的公众号：每天AI新工具

广告：私人定制视频文本提取，字幕翻译制作等，欢迎联系QQ:1752338621