AI 新工具

AI新工具(20240904) 使用Cloudflare构建RAG应用;端到端语音开源大模型;AI幻灯片生成器,等六个开源项目


  • By AiBard123
  • September 4, 2024 - 2 min read



✨ 1: Cloudflare RAG

如何使用Cloudflare构建一个完整的RAG应用,结合多种搜索技术和AI服务。

Cloudflare RAG(Retrieval Augmented Generation)是一个全栈示例,展示如何使用 Cloudflare 构建 RAG 应用程序。该项目结合了 Cloudflare Workers、Pages、D1、KV、R2、AI Gateway 和 Workers AI 等技术,以实现强大的检索增强生成能力。

流式交互: 使用服务器推送事件(Server-Sent Events)实时更新用户界面。 混合检索: 结合 D1 的全文搜索和 Vectorize 的向量检索,提供最佳检索结果。 多供应商切换: 通过 AI Gateway 在 OpenAI、Groq 和 Anthropic 等不同提供商之间切换,并提供后备支持。 IP 限速: 利用 Cloudflare 的 KV 实现按 IP 限速。 OCR 功能: 使用 unpdf 库在 Cloudflare Worker 中实现光学字符识别。 智能负载均衡: 自动优化工作负载的放置,以减少延迟并加速应用程序。

地址:https://github.com/RafalWilinski/cloudflare-rag

✨ 2: Claude Customer Support Agent

Claude客服支持代理是一个高级、可定制的聊天界面,结合了AI和AWS知识库。

Claude Customer Support Agent 是一个先进的、完全可定制的客户支持聊天界面,基于 Anthropic 的 Claude 模型,并利用 Amazon Bedrock 知识库进行知识检索。

AI 驱动聊天:使用 Anthropic 的 Claude 模型进行对话。 知识检索:集成 Amazon Bedrock,以获取上下文知识。 实时思考与调试信息展示知识库来源可视化用户情绪检测及合适的代理重定向高度可定制的用户界面,采用 shadcn/ui 组件。

地址:https://github.com/anthropics/anthropic-quickstarts/blob/main/customer-support-agent/README.md

✨ 3: Mini-Omni

Mini-Omni是一款开源大型语言模型,具备实时语音对话和边思考边发声的能力。

Mini-Omni是一个开源的多模态大型语言模型,具备“听”和“说”的能力,能够实现实时的端到端语音输入与流式音频输出的对话功能。它的设计使得用户能够在对话时“边思考边说”,实现文本与音频的同步生成。

实时语音对话:支持直接进行语音到语音的对话,无需额外的自动语音识别(ASR)或文本到语音(TTS)模型。 边思考边说:可以在生成文本的同时输出音频。 流式音频输出:支持实时的音频流输出。 批次推理:通过“音频到文本”和“音频到音频”的批次推理,进一步提升性能。

地址:https://github.com/gpt-omni/mini-omni

✨ 4: Llama-Slides

Llama-Slides是一款幻灯片生成器,可根据演讲笔记自动生成简洁美观的幻灯片。

Llama-Slides 是一款演示文稿生成器,它旨在简化演示者制作幻灯片的过程。该工具的设计理念来自于演讲者在准备演讲时通常会撰写详细的讲稿。Llama-Slides 允许用户将这些讲稿转换为幻灯片,减轻了制作幻灯片的工作量,同时保持了内容的清晰和简洁。

讲稿转幻灯片:用户的原始讲稿会转化为幻灯片,使用了 PptxGenJS 工具。 实时预览:通过 react-pptx 实现幻灯片的实时预览。 内容生成:幻灯片内容由 Anthropic 的 Claude 生成,使用前需要提供 API 密钥。 发言者备注:原始讲稿内容会作为发言者备注保留,方便在 PowerPoint 中查看。 幻灯片清理功能:如果初始生成的幻灯片不够美观,可以使用清理按钮,Claude 会对幻灯片进行点评并提供改进建议。 下载功能:用户可以直接下载生成的 PowerPoint 文件。

地址:https://github.com/run-llama/llama-slides

✨ 5: data-to-paper

data-to-paper是一个系统化框架,通过AI推动科学研究,从原始数据到可验证的研究论文,实现透明可追溯的研究过程。

data-to-paper 是一个系统性框架,通过人工智能的力量完成从原始数据到科学论文的全过程。这一流程强调透明性、可追溯性和人类可验证性,确保研究结果的可靠性。

数据链连接的手稿:研究结果、方法和数据之间通过编程方式关联,所有数值可追溯到生成它们的代码行。 领域无关性:旨在尽可能广泛应用于不同研究领域。 灵活目标研究:可以自主提出和测试假设,也可以测试用户提供的具体假设。 编码防护措施:通过多重防护措施,减少常见编程错误。 人机互动:提供图形用户界面,允许用户对研究过程进行监督和干预。 记录与回放:整个过程被记录,包括所有决策和反馈,确保透明性。

地址:https://github.com/Technion-Kishony-lab/data-to-paper

✨ 6: Chat UI

Chat UI是一个基于开源模型的聊天界面,支持快速部署和本地运行,适用于不同的对话生成需求。

Chat UI 是一款基于开源模型(如 OpenAssistant 或 Llama)构建的聊天界面应用程序。它是一个基于 SvelteKit 的应用,用于提供实时交互的聊天功能。Chat UI 作为 Hugging Face 官网 HuggingChat 应用的核心组件,旨在为用户提供一个友好的聊天体验。

聊天界面:用户可以与聊天机器人进行实时互动。 模型支持:支持多种文本生成模型,允许自定义使用不同的语言模型(LLM)。 数据库支持:聊天历史存储在 MongoDB 中,以便进行持久化和检索。 Web 搜索功能:能够生成适当的搜索查询并从网页中提取相关信息,增强模型的回复能力。

地址:https://github.com/huggingface/chat-ui



更多AI工具,参考国内AiBard123Github-AiBard123 公众号:每日AI新工具

可关注我们的公众号:每天AI新工具

广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:1752338621