AI新工具(20241028) 智谱AI发布开源情感语音端到端模型;AI播客火爆meta开源NotebookLlama;多语言的食谱语音助手
✨ 1: GLM-4-Voice
GLM-4-Voice是智谱AI推出的语音模型,可进行中英文实时语音对话并调节语音特性。
GLM-4-Voice 是由智谱 AI 推出的一个端到端语音模型,能够理解和生成中英文语音,以实现实时语音对话。该模型具备根据用户指令调整语音情感、语调、语速及方言等特性的能力,展现出灵活的语音合成表现。
GLM-4-Voice 在语音对话和合成领域展现了广泛的应用潜力,为用户带来了更生动、自然的交流体验。
地址:https://github.com/THUDM/GLM-4-Voice
✨ 2: NotebookLlama
NotebookLlama是一个开源项目,旨在将PDF文档转换为播客,涵盖多个处理步骤。
NotebookLlama 是一个开源项目,旨在帮助用户将 PDF 文档转换为播客,涵盖从文本处理到语音合成的整个工作流程。该项目包含多个 Jupyter Notebook,逐步引导用户进行工作,适合零基础的用户学习。
项目还鼓励用户在使用中进行实验和改进,包括使用不同的模型和设置,支持将网站、音频文件和YouTube链接等多种输入形式纳入流程。
NotebookLlama提供了丰富的学习资源,适合希望深入了解文本生成和语音合成的开发者。
地址:https://github.com/meta-llama/llama-recipes/tree/main/recipes/quickstart/NotebookLlama/
✨ 3: AyaMCooking
AyaMCooking是一款支持多语言的语音助手,帮助用户生成食谱、提供烹饪建议及营养信息。
AyaMCooking是一款基于语音的多语言料理助手,支持10种语言的智能对话,旨在成为您厨房中的完美帮手。它采用先进的多语言工作流,能够为用户提供丰富的烹饪支持,包括生成个性化食谱、建议食材替代、提供营养信息等多项功能。
地址:https://github.com/bhavnicksm/AyaMCooking
✨ 4: Doc2Podcast
Doc2Podcast 是一个 AI 工具,能将 PDF 文档转化为引人入胜的播客音频内容。
Doc2Podcast 是一个基于人工智能的工具,可以将 PDF 文档转换为引人入胜的播客风格音频内容。该项目利用 Next.js、React 和 Langflow 的技术,为用户生成音频内容,帮助将书面资料以更生动的方式呈现。
Doc2Podcast 通过将文档转为音频,能够让信息的传播变得更加灵活、多样化,适合各类用户需求。
地址:https://github.com/misbahsy/Doc2Podcast
✨ 5: Computer Use - OOTB
这是一个无需Docker的解决方案,支持远程控制电脑,提供用户友好的Gradio界面。
Computer Use - OOTB(开箱即用的计算机使用)是Claude的新计算机使用API的解决方案,方便用户在各种平台上使用,当前已在Windows上进行了测试。该项目基于Gradio提供用户友好的界面,无需Docker即可安装和运行。
Computer Use - OOTB 提供了一个创新的平台,允许用户通过简单的界面实现对计算机的远程控制,适合现代数字化办公环境,且随着功能不断增加,未来有望支持更多设备和操作系统。
地址:https://github.com/showlab/computer_use_ootb
更多AI工具,参考国内AiBard123,Github-AiBard123 公众号:每日AI新工具
广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:1752338621