AI 新工具

AI新工具(20250206) AI驱动的研究助手深度迭代研究并生成详尽报告Open Deep Research;与DeepSeek AI聊天API交互DeepSeek4Free





✨ 1: Open Deep Research

Open Deep Research 是一个AI驱动的研究助手,能为任何主题进行深度迭代研究并生成详尽报告。

Open Deep Research 是一个基于人工智能的研究助手,旨在通过结合搜索引擎、网络爬虫和大型语言模型,对任何主题进行深入的迭代研究。该项目的目标是提供一种最简单的深度研究代理实现,能够随着时间推移不断优化研究方向并深入探讨主题。该工具的代码量保持在500行以下,便于理解和进一步开发。

Open Deep Research 的主要功能

迭代研究:通过生成搜索查询、处理结果,并根据发现深入探索,实现深度研究。 智能查询生成:利用大型语言模型生成基于研究目标和先前发现的针对性搜索查询。 深度与广度控制:可配置的参数来控制研究的广度和深度。 智能跟进:生成后续问题以更好地理解研究需求。 全面报告:生成详细的 markdown 格式报告,包括发现和来源。 并发处理:高效处理多个搜索和结果处理。

地址:https://github.com/dzhng/deep-research

✨ 2: Multimodal Open R1

Multimodal Open R1项目通过开源的数学推理数据集和模型,推动多模态强化学习的发展与研究。

Multimodal Open R1 是一个针对多模态模型的研究和开发项目,致力于探索和实现基于 GRPO(Generalized Reinforcement Policy Optimization)算法的多模态强化学习(RL)模型。该项目主要以数学推理为主题,推出了首批 8,000 个多模态 RL 训练示例。这些数据由 GPT-4o 生成,包含推理路径和可验证答案,数据源于 Math360KGeo170K

项目的重要特性包括:

  • 结合了多个现有的多模态模型如 Qwen2-VL 系列、Aria-MoE,基于 Hugging Face 的开源库进行实现。
  • 提供了可公开访问的多模态数据集,并实时开放用户生成数据的脚本,使研究者能够自主探索数据的创建。
  • 关注模型在多选题(MCQ)场景下的能力,讨论了如何确保模型的选择过程是有效的,以及如何改善模型的推理能力。

地址:https://github.com/EvolvingLMMs-Lab/open-r1-multimodal

✨ 3: Open Operator

Open Operator是一个概念验证工具,旨在提供构建网页代理所需的所有工具。

Open Operator 是一个实验性项目,旨在提供构建网页代理所需的工具,而不是与现有的网络代理工具竞争。用户可以通过利用 Open Operator 和相关的开源项目 Stagehand,轻松构建自己的网页代理,实现对网页的自动化操作。

地址:https://github.com/browserbase/open-operator

✨ 4: LLM-Reasoner

LLM-Reasoner是一款增强大型语言模型(LMM)思维能力的工具,支持逐步推理和实时进度展示。

LLM-Reasoner 是一款工具,可以优化大语言模型(LLM)的推理能力,使其像 OpenAI 的 O1 和 deepseek R1 一样进行深度思考。其核心功能包括逐步推理、实时进展展示,以及支持多种提供商的模型。这款工具的用户界面友好,支持 CLI 模式,适合不同用户需求。

地址:https://github.com/harishsg993010/LLM-Reasoner

✨ 5: DeepSeek4Free

DeepSeek4Free是一个Python库,方便与DeepSeek AI聊天API交互,支持流式响应和网页搜索功能。

DeepSeek4Free 是一个用于与 DeepSeek AI 聊天 API 交互的 Python 包。该包提供了一个简洁的接口,可以与 DeepSeek 的聊天模型进行交互,支持流式响应、思维过程可视化以及网页搜索功能。这使得开发者能够轻松集成 IA 聊天功能到他们的应用程序中。

地址:https://github.com/xtekky/deepseek4free



更多AI工具,参考国内AiBard123Github-AiBard123 公众号:每日AI新工具

可关注我们的公众号:每天AI新工具

广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:1752338621