AI新工具(20240924) 将PDF文件转换为音频播客、讲座和摘要PDF2Audio;Open WebUI & Ollama的代码执行工具
✨ 1: PDF to Audio Converter
PDF转音频转换器可以将PDF文件转换为音频播客、讲座和摘要,支持多种自定义选项。
PDF to Audio Converter 是一款强大的工具,能够将PDF文档转换为音频格式,例如播客、讲座和摘要等。该工具利用OpenAI的GPT模型进行文本生成和语音合成,同时允许用户对文本进行多次编辑和提供反馈,以便优化生成的音频内容。
主要功能
支持上传多个PDF文件。 提供多种指令模板选择(如播客、讲座、摘要等)。 可定制文本生成和音频模型。 可以选择不同的语音进行朗读。 用户可以通过具体或通用的评论进行迭代改进草稿。
地址:https://github.com/lamm-mit/PDF2Audio
✨ 2: Llama Researcher
何使用LlamaIndex工作流程创建Llama-Researcher,结合Tavily API进行主题研究。
Llama Researcher是一款基于LlamaIndex工作流的研究工具,受到GPT-Researcher的启发。它结合了多种技术,包括LlamaIndex工作流的编排、Tavily API作为搜索引擎接口,以及其他LlamaIndex的抽象,如向量存储索引(VectorStoreIndex)和后处理器(PostProcessors)等。
地址:https://github.com/rsrohan99/Llama-Researcher
✨ 3: Code execution for Open WebUI
Open WebUI 提供安全的代码执行功能,使用 gVisor 沙箱技术,支持多种执行方式。
Code execution for Open WebUI 是一个针对 Open WebUI 的代码执行功能,利用 gVisor 实现安全的代码沙箱执行。这一功能允许用户在一个受限的环境中运行任意代码,确保安全性。这一系统同样是 ChatGPT 所使用的沙箱技术。
该功能包括两种类型:代码执行功能和代码执行工具,用户可以根据需求选择安装。
代码执行功能
功能描述:在 LLM 生成的消息下方显示“运行代码”按钮,点击后可执行相关的代码块,输出结果会在用户界面中显示,并可供 LLM 进行进一步查询。 使用方法:用户可以请求模型生成代码,然后点击运行按钮进行执行。
地址:https://github.com/EtiennePerot/open-webui-code-execution
✨ 4: ragapp
RAGapp 通过 Docker 实现简单易用的 Agentic RAG 部署,支持自有云基础设施。
RAGapp是一个基于代理的检索增强生成(Agentic RAG)平台,为企业提供了一种简单易用的解决方案。其配置方式与OpenAI的自定义GPT相似,但可以在用户自己的云基础设施上通过Docker进行部署。RAGapp利用LlamaIndex构建,旨在为用户提供灵活的AI集成方案。
地址:https://github.com/ragapp/ragapp
✨ 5: Local File Organizer
本地文件整理器利用AI技术在用户设备上自动整理文件,保护隐私,提升文件管理效率。
Local File Organizer是一款先进的文件管理工具,专为帮助用户整理电脑上混乱的文件而设计。其核心技术基于人工智能(AI),包括语言模型(LM)和视觉-语言模型(VLM),能够自动扫描指定目录中的文件,对其进行内容分析,生成相关描述、文件夹名称和文件名,并根据这些元数据重新组织文件结构。所有处理都在用户本地设备上完成,无需互联网连接,确保用户的隐私得到良好保护。
地址:https://github.com/QiuYannnn/Local-File-Organizer
更多AI工具,参考国内AiBard123,Github-AiBard123 公众号:每日AI新工具
广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:1752338621