AI新工具(20250303) 让AI自动玩超级玛丽、2048和俄罗斯方块等游戏;精准虚拟试穿Leffa;智能体新型记忆系统

✨ 1: GamingAgent
GamingAgent是个人电脑游戏智能体,通过API和策略,让AI自动玩超级玛丽、2048和俄罗斯方块等游戏。
GamingAgent 是一个旨在提供便捷方案,用于部署可在个人电脑和笔记本电脑上运行的计算机使用代理 (CUA) 的项目。目前该项目专注于构建本地游戏代理。它使用大型语言模型 (LLM) 作为智能体,通过视觉输入,操控电脑上的游戏。目前支持的游戏包括超级马里奥兄弟、2048 和俄罗斯方块。
核心功能:
- 游戏代理: 提供用于控制平台游戏和 Atari 游戏的智能代理。
- 多模型支持: 支持 OpenAI (gpt-4o, gpt-4o-mini, o1), Anthropic (claude-3-5-sonnet-20241022, claude-3-7-sonnet-20250219) 和 Gemini (gemini-1.5-pro) 等多种 LLM。
- 可定制策略: 允许用户自定义游戏策略,例如在
mario_agent.py
中实现不同的马里奥策略,可以选择高并发的短期规划和低并发的长期规划。 - 易于安装和使用: 提供详细的安装步骤和简单的命令行启动方式。
地址:https://github.com/lmgame-org/GamingAgent
✨ 2: Search-R1
Search-R1使用强化学习训练LLM,使其具备推理能力并能调用搜索引擎,复现DeepSeek-R1方法。
Search-R1 是一个项目,旨在复现 DeepSeek-R1 的方法,使用强化学习训练大型语言模型(LLM)具备推理和调用搜索引擎的能力,让LLM可以边推理边搜索(tool-call)。它基于 veRL 开发。通过强化学习 (rule-based outcome reward),能让像 Qwen2.5-3b-base 和 Llama3.2-3b-base 这样的3B基础语言模型自主地学习推理和调用搜索引擎。
地址:https://github.com/PeterGriffinJin/Search-R1
✨ 3: LangGraph Multi-Agent Swarm
LangGraph Multi-Agent Swarm是一个Python库,用于创建swarm风格的多智能体系统,实现智能体间的动态控制权转移和记忆。
LangGraph Multi-Agent Swarm 是一个基于 LangGraph 的 Python 库,用于创建群集式多代理系统。
核心概念:
- 群集 (Swarm): 一种多代理架构,其中代理根据其专业领域动态地将控制权相互传递。
- 动态控制权传递: 允许具备不同专业技能的Agent协同工作,并将上下文信息传递给适合处理下一步任务的Agent。
- 记忆功能: 系统会记住上次活跃的代理,确保后续交互能从该代理继续。
地址:https://github.com/langchain-ai/langgraph-swarm-py
✨ 4: Leffa
Leffa是可控人物图像生成的统一框架,通过注意力机制精确控制人物的外观和姿态。
Leffa是一个统一的框架,用于可控的人物图像生成,能够精确地控制人物的外观(如虚拟试穿)和姿势(如姿势迁移)。 它的核心在于通过学习注意力中的流动场(learning flow fields in attention),即在训练过程中显式地引导目标查询去关注参考图像中正确的对应区域。具体来说,Leffa通过在基于扩散的基线模型之上添加一个正则化损失来实现这一点。
使用场景:
- 虚拟试穿 (Virtual Try-On): 将服装应用于目标人物图像,模拟试穿效果。
- 姿势迁移 (Pose Transfer): 将目标人物图像的姿势迁移到参考人物图像上。
- 可控的人物图像生成: 允许用户精确控制生成人物图像的外观和姿势。
地址:https://github.com/franciszzj/Leffa
✨ 5: Agentic Memory
Agentic Memory是一种新型LLM智能体记忆系统,采用智能化的动态组织方式,提升记忆管理和利用效率。
Agentic Memory 是一种为大型语言模型 (LLM) 智能体设计的新型记忆系统。它不同于传统的记忆系统,传统记忆系统通常只提供基本的存储和检索功能。Agentic Memory 的核心在于其动态组织记忆的能力,使其能够像一个智能体一样,根据 Zettelkasten 原则,动态地组织记忆。这种系统能够智能地索引、链接、生成结构化的记忆笔记,构建互联的知识网络,并持续地进化和完善记忆。更重要的是,智能体本身能够驱动记忆的管理,进行自适应的决策,从而更有效地利用历史经验。
地址:https://github.com/WujiangXu/AgenticMemory
更多AI工具,参考国内AiBard123,Github-AiBard123 公众号:每日AI新工具
广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:1752338621