AI 新工具

AI新工具 继Midjourney后PixVerse也能够保持角色一致性;OpenAI推出Voice Engine可根据文本和15秒音频样本生成自然发音





✨ 1: PixVerse

能够在保持角色一致性的同时生成多样化场景动态视频的AI工具

PixVerse的强大之处在于其能够在保持角色一致性的基础上,生成带有丰富背景元素和角色动态的视频,大大提高了生成内容的生动性和真实感。无论是换背景、增加动态效果,还是进行创意表达,PixVerse都能够帮你轻松实现。

地址:https://app.pixverse.ai/

✨ 2: Suno-API

基于Python和FastAPI构建的非官方API,主要用于生成歌曲、歌词等

Suno-API是一个基于Python和FastAPI构建的非官方API,主要用于生成歌曲、歌词等。这个API的一个亮点在于它具有自动管理token和保持token活跃的功能,这意味着用户无需担心token过期的问题。

地址:https://github.com/SunoAI-API/Suno-API

✨ 3: LLM Twin Course

免费课程,向你展示如何设计、训练和部署一个准备就绪的生产标准的 LLM(大型语言模型)

LLM Twin Course 是一个免费课程,向你展示如何设计、训练和部署一个准备就绪的生产标准的 LLM(大型语言模型)。这个过程涵盖了从数据收集到部署的全套流程,同时教授利用 MLOps 最佳实践,例如实验跟踪器、模型注册表、提示监控和版本控制。

地址:https://github.com/decodingml/llm-twin-course

✨ 4: Voice Engine

OpenAI推出了名为Voice Engine的模型,可根据文本和15秒音频样本生成自然发音

Voice Engine是一个由OpenAI开发的先进技术,它利用文本输入和一个15秒长的音频样本来生成接近原始说话者声音的自然听起来的语音。这项技术能够以情感丰富和逼真的方式复制人声,即使是用很小的模型和简短的音频样本也能达到这一点。Voice Engine的开发始于2022年末,其应用场景广泛,包括为ChatGPT Voice和Read Aloud提供预设语音,并通过文本转语音API服务。

OpenAI当前只进行了小规模预览并尚未广泛发布这项技术,但它旨在分享Voice Engine的潜在用途,并激励社会提高对通过生成模型带来的挑战的抵抗力。这包括鼓励逐步淘汰基于声音的身份验证措施,探索保护个人声音使用的政策,教育公众理解AI技术的能力和限制,以及加速开发和采用跟踪视听内容来源的技术。

地址:https://openai.com/blog/navigating-the-challenges-and-opportunities-of-synthetic-voices



更多AI工具,参考国内AiBard123Github-AiBard123

可关注我们的公众号:每天AI新工具

广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:1752338621