AI新工具
banner

funaudiollm-app


介绍:

funaudiollm-app 提供语音聊天与实时翻译功能,提升音频体验。









funaudiollm-app

funaudiollm-app项目简介

funaudiollm-app项目是一个结合了高级音频理解和语音生成模型的应用程序集合,旨在提升您的音频体验。该项目包含两个主要应用:

  1. 语音聊天 (Voice Chat):这款应用提供互动和自然的聊天体验,使得在各种环境下更容易采用复杂的AI驱动对话。

  2. 语音翻译 (Voice Translation):这款实时语音翻译工具可以打破语言障碍,实时翻译口语,使不同语言的使用者之间的沟通更为流畅有效。

使用场景
  1. 语音聊天

    • 客户服务:利用AI驱动的自然对话提升客户服务体验。
    • 教育辅导:提供互动式学习平台,帮助学生与虚拟导师交流。
    • 个人助理:作为虚拟助手帮助用户完成日常任务,如设置提醒、查询信息等。
  2. 语音翻译

    • 跨国业务交流:帮助在不同语言背景下的团队进行无障碍沟通。
    • 旅行翻译:为旅行者提供实时翻译服务,克服语言障碍。
    • 医疗援助:帮助医生和非本地语言患者进行交流,提供更好的医疗服务。
安装步骤
  1. 克隆和安装仓库
git clone --recursive URL
# 如果由于网络问题克隆子模块失败,重复运行以下命令直到成功
cd funaudiollm-app
git submodule update --init --recursive
  1. 准备环境(根据cosyvoice和sensevoice仓库配置环境)并执行以下命令:
pip install -r requirements.txt
基本用法

准备工作

语音聊天启动命令

cd voice_chat
sudo CUDA_VISIBLE_DEVICES="0" DS_API_TOKEN="YOUR-DS-API-TOKEN" python app.py >> ./log.txt

访问:https://YOUR-IP-ADDRESS:60001/

语音翻译启动命令

cd voice_translation
sudo CUDA_VISIBLE_DEVICES="0" DS_API_TOKEN="YOUR-DS-API-TOKEN" python app.py >> ./log.txt

访问:https://YOUR-IP-ADDRESS:60002/

通过这些步骤和设置,您可以充分利用funaudiollm-app带来的先进音频理解和语音生成功能,提升在各种应用场景下的音频体验。

可关注我们的公众号:每天AI新工具

广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:1752338621