FunAudioLLM FunAudioLLM FunAudioLLM 是阿里巴巴集团Tongyi SpeechTeam推出的用于增强人类与大语言模型（LLM）自然语音交互的框架。该框架的核心包括两个创新的模型：SenseVoice和CosyVoice。 SenseVoice：这是一个多功能语音理解模型，具备高

FunAudioLLM

FunAudioLLM 是阿里巴巴集团Tongyi SpeechTeam推出的用于增强人类与大语言模型（LLM）自然语音交互的框架。该框架的核心包括两个创新的模型：SenseVoice和CosyVoice。

FunAudioLLM整合SenseVoice和CosyVoice，实现了语音翻译、情感语音聊天、互动播客和富有表现力的有声书叙述等应用。这些模型已在Modelscope和Huggingface开源，并在GitHub上发布了相关的训练、推理和微调代码，推进了语音交互技术的发展。

具体应用包括：

此外，SenseVoice 提供了多语言语音识别、语音情感识别和音频事件检测能力，大幅度提升了语音理解的准确性和效率。整合这些功能，FunAudioLLM致力于突破语音交互技术的界限，提供更自然、准确和情感丰富的语音交流体验。

可关注我们的公众号：每天AI新工具

广告：私人定制视频文本提取，字幕翻译制作等，欢迎联系QQ:1752338621