AI新工具 继Midjourney后PixVerse也能够保持角色一致性;OpenAI推出Voice Engine可根据文本和15秒音频样本生成自然发音
✨ 1: PixVerse
能够在保持角色一致性的同时生成多样化场景动态视频的AI工具
PixVerse的强大之处在于其能够在保持角色一致性的基础上,生成带有丰富背景元素和角色动态的视频,大大提高了生成内容的生动性和真实感。无论是换背景、增加动态效果,还是进行创意表达,PixVerse都能够帮你轻松实现。
地址:https://app.pixverse.ai/
✨ 2: Suno-API
基于Python和FastAPI构建的非官方API,主要用于生成歌曲、歌词等
Suno-API是一个基于Python和FastAPI构建的非官方API,主要用于生成歌曲、歌词等。这个API的一个亮点在于它具有自动管理token和保持token活跃的功能,这意味着用户无需担心token过期的问题。
地址:https://github.com/SunoAI-API/Suno-API
✨ 3: LLM Twin Course
免费课程,向你展示如何设计、训练和部署一个准备就绪的生产标准的 LLM(大型语言模型)
LLM Twin Course 是一个免费课程,向你展示如何设计、训练和部署一个准备就绪的生产标准的 LLM(大型语言模型)。这个过程涵盖了从数据收集到部署的全套流程,同时教授利用 MLOps 最佳实践,例如实验跟踪器、模型注册表、提示监控和版本控制。
地址:https://github.com/decodingml/llm-twin-course
✨ 4: Voice Engine
OpenAI推出了名为Voice Engine的模型,可根据文本和15秒音频样本生成自然发音
Voice Engine是一个由OpenAI开发的先进技术,它利用文本输入和一个15秒长的音频样本来生成接近原始说话者声音的自然听起来的语音。这项技术能够以情感丰富和逼真的方式复制人声,即使是用很小的模型和简短的音频样本也能达到这一点。Voice Engine的开发始于2022年末,其应用场景广泛,包括为ChatGPT Voice和Read Aloud提供预设语音,并通过文本转语音API服务。
OpenAI当前只进行了小规模预览并尚未广泛发布这项技术,但它旨在分享Voice Engine的潜在用途,并激励社会提高对通过生成模型带来的挑战的抵抗力。这包括鼓励逐步淘汰基于声音的身份验证措施,探索保护个人声音使用的政策,教育公众理解AI技术的能力和限制,以及加速开发和采用跟踪视听内容来源的技术。
地址:https://openai.com/blog/navigating-the-challenges-and-opportunities-of-synthetic-voices
更多AI工具,参考国内AiBard123,Github-AiBard123
广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:1752338621