Search-R1 By AiBard123 March 3, 2025 - 2 min read Search-R1使用强化学习训练LLM,使其具备推理能力并能调用搜索引擎,复现DeepSeek-R1方法。 read more
GamingAgent By AiBard123 March 3, 2025 - 2 min read GamingAgent是个人电脑游戏智能体,通过API和策略,让AI自动玩超级玛丽、2048和俄罗斯方块等游戏。 read more
Control Plane For Your AI Agents By AiBard123 February 28, 2025 - 2 min read Mahilo是AI Agent的控制平台,可创建或注册多Agent,实现团队协作、信息共享和人工监督。 read more
Agent Leaderboard By AiBard123 February 28, 2025 - 2 min read Agent Leaderboard评估AI在真实商业场景中利用工具的能力,使用TSQ指标衡量模型表现并提供排行榜。 read more
Luxirty Search By AiBard123 February 28, 2025 - 2 min read Luxirty Search是一个基于Google的无广告、无跟踪搜索引擎,内置内容农场屏蔽和优质网站权重提升功能。 read more
DualPipe By AiBard123 February 28, 2025 - 2 min read DualPipe是DeepSeek-V3提出的创新双向流水线并行算法,可实现前向后向计算通信全重叠并减少流水线气泡。 read more