AI 新工具

AI新工具(20240703) 开源TTS模型支持中日韩并可以微调自己的声音模型;微软开源的知识图谱RAG;RAG和LLMs构建的搜索应用程序





✨ 1: Fish Speech

Fish Speech 开源TTS模型支持中日韩,语音合成不止于自然

Fish Speech 是一个开源的语音生成项目,致力于开发和改进语音合成技术。项目最新稳定版本为1.1.2,并正在向1.2版本更新中。 Fish Speech 虽然仅为亿级参数的模型,经过了30万小时的英语、中文和日语音频数据训练,可以进行微调,只需要短短的自己音频样本,就能复刻效果逼真的声音。

个人和研究使用:由于项目基于开源许可证,个人和研究人员可以自由使用项目代码和模型进行非商业研究和开发。 语音合成:可用于开发多种语音合成应用,如语音助理、自动播报系统等。 教育和教学:作为教学和学习语音合成技术的工具,帮助学生和研究人员更好地理解相关算法和实现。

地址:https://github.com/fishaudio/fish-speech

✨ 2: GraphRAG

GraphRAG 微软开源的知识图谱RAG

GraphRAG 是一个数据管道和转换套件,旨在利用大型语言模型(LLMs)的强大功能,从非结构化文本中提取有意义的结构化数据。GraphRAG 通过构建知识图谱,增强 LLM 对私人数据的推理能力。

地址:https://github.com/microsoft/graphrag

✨ 3: txtchat

txtchat 利用检索增强生成模型和语言模型构建智能对话搜索应用。

txtchat 是一个利用检索增强生成(RAG)和大语言模型(LLMs)构建的搜索应用程序。它不仅能够返回搜索结果,还能通过提取、总结、翻译和转换内容来提供答案。txtchat 通过集成智能代理,与消息平台进行互动。这些代理与自动化账户相关联,能够使用 AI 驱动响应来回答消息。工作流程可以使用大型或小型语言模型,又或者是两者的结合。

与维基百科聊天: 使用 Wikipedia 嵌入索引和 LLM 提示来回答问题。 文本总结: 从输入的网址读取内容并生成摘要。 文本翻译: 翻译输入的文本为法语。 领域知识问答: 定制工作流程,将数据连接到特定领域(例如 Hacker News)以生成针对性的回答,同时提供数据来源参考。

想要进一步了解和使用 txtchat,可以创建和运行自定义的 txtai 工作流程,并将其应用到不同的消息平台上,达到丰富交流和信息获取的功能。

地址:https://github.com/neuml/txtchat

✨ 4: Removerized

Removerized是一款免费的AI工具,可轻松去除图片背景,支持离线使用。

Removerized 是一个免费且功能强大的 AI 背景移除工具。它具有以下主要特性:

AI驱动的背景移除:使用人工智能技术,支持快速且精准地移除图片背景。 免费且无限制:没有任何隐藏费用或使用限制。 离线支持:无需互联网连接即可使用。 快速且精确:AI技术确保移除背景过程快捷且准确。 易于使用:用户界面友好,提供无缝操作体验。 用途广泛:适用于各种图片和场景。

地址:https://github.com/yossTheDev/removerized

✨ 5: local-gemma

local-gemma 是一个可以在本地快速运行 Gemma-2 模型的 Python 库和 CLI 工具。

local-gemma 是一个方便的工具库,允许用户在本地快速运行 Gemma-2 模型。它基于 🤗 Transformersbitsandbytes 构建,可以直接从命令行或通过 Python 库运行 Gemma-2。local-gemma 提供与原始实现完全等效的结果,或者可以在内存需求上做出优化,减少到仅模型中最大的层。

local-gemma 为使用 Gemma-2 提供了便捷和高效的途径,无论是通过命令行还是在 Python 中运行都十分方便。

地址:https://github.com/huggingface/local-gemma



更多AI工具,参考国内AiBard123Github-AiBard123 公众号:每日AI新工具

可关注我们的公众号:每天AI新工具

广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:1752338621