AI 新工具

AI新工具(20241113) 微软开源模拟个性化多代理角色TinyTroupe;阿里开源代码模型Qwen2.5-Coder;利用Llama 3.2 Vision进行免费OCR


  • By AiBard123
  • November 13, 2024 - 2 min read



✨ 1: TinyTroupe

TinyTroupe是一个基于大型语言模型的Python库,能够模拟个性化多代理角色,助力商业洞察与创意拓展。

TinyTroupe 是一款实验性的 Python 库,旨在通过大规模语言模型(如 GPT-4)模拟具有人格特征、兴趣和目标的虚拟角色(即 TinyPerson),以增强想象力和获取商业洞察。TinyTroupe 允许用户在特定的模拟环境(称为 TinyWorld)中创建和管理这些角色,让它们相互交互并做出反应。这种方法的重点在于对人类行为的理解,而不是直接支持人类行为,从而使其更适合于生产力和商业场景。

地址:https://github.com/microsoft/TinyTroupe

✨ 2: Qwen2.5-Coder

Qwen2.5-Coder是一款强大、丰富且实用的开源代码模型,支持多种编程语言与长文本理解。

Qwen2.5-Coder是一个开源的强大且多样化的代码生成模型系列,旨在持续推动开放源代码大型语言模型(Open CodeLLMs)的发展。与之前的版本相比,Qwen2.5-Coder在多个方面进行了提升和扩展:

强大:Qwen2.5-Coder-32B-Instruct模型成为当前最先进的开源代码模型,具备与GPT-4o相媲美的编程能力,能够很好地处理编程任务,同时具有良好的通用和数学能力。

多样化:此次发布了四个模型规模,包括0.5B、3B、14B和32B,以满足不同开发者的需求,覆盖了六种主流模型规模。

实用:Qwen2.5-Coder探索了其在代码助手和Artifacts等实际场景中的应用,展示了Qwen2.5-Coder在现实场景中的潜力。

地址:https://github.com/QwenLM/Qwen2.5-Coder

✨ 3: Llama OCR

Llama OCR 是一款npm库,利用Llama 3.2 Vision进行免费OCR图像识别处理。

Llama OCR 是一个基于 npm 的开源库,旨在利用 Llama 3.2 Vision 提供免费的光学字符识别(OCR)功能。用户可以通过简单的 API 调用,将图片中的文本解析为 Markdown 格式,极大地方便了文本提取的应用场景。

地址:https://github.com/Nutlope/llama-ocr

✨ 4: Lingma SWE-GPT

Lingma SWE-GPT是一个开源大语言模型,专注于软件工程领域的智能辅助和改进任务。

Lingma SWE-GPT(SWESynInfer)是一个开源的大型语言模型,专为软件工程领域的任务而设计。它是在Qwen系列基础模型的基础上进行增强训练,使用软件工程开发过程数据,从而提升其在复杂软件工程任务中的能力。

SWESynInfer是一个三阶段的软件工程过程数据合成与推理工作流程,扩展了公开的AutoCodeRover框架。该框架提供了上下文检索和补丁生成的基本流程,而我们的工作进一步引入了关键增强,以更准确地模拟专家开发人员的认知过程。

地址:https://github.com/LingmaTongyi/Lingma-SWE-GPT

✨ 5: AutoRAG

AutoRAG 是一款自动化工具,可帮助用户根据数据优化检索增强生成(RAG)管道。

AutoRAG 是一个自动化机器学习工具,旨在帮助用户为其数据自动寻找最佳的检索增强生成(RAG)管道。在众多可用的 RAG 模块和管道中,很难确定哪个最适合用户特定的数据和用例。AutoRAG 通过用户提供的评估数据,自动评估不同的 RAG 模块组合,找到最优的解决方案,从而节省了大量的时间和精力。

通过 AutoRAG,用户可以方便地创建数据集、评估和优化他们的 RAG 管道,进而提高工作效率和成果的可靠性。

地址:https://github.com/Marker-Inc-Korea/AutoRAG



更多AI工具,参考国内AiBard123Github-AiBard123 公众号:每日AI新工具

可关注我们的公众号:每天AI新工具

广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:1752338621