train-deepseek-r1 By AiBard123 February 21, 2025 - 2 min read DeepSeek R1 通过强化学习和手绘示意图,逐步实现高效的模型训练,以提升其推理能力。 read more
SongGen By AiBard123 February 21, 2025 - 2 min read SongGen是一种单阶段自回归变换器,可根据文本生成歌曲,支持多种控制方式与模式。 read more
Open Reasoner Zero By AiBard123 February 21, 2025 - 2 min read Open Reasoner Zero是一个开源项目,旨在提升大规模推理导向的强化学习训练的可扩展性和简便性。 read more
Crawl4LLM By AiBard123 February 21, 2025 - 2 min read Crawl4LLM是一个高效的网页爬虫工具,旨在为大型语言模型预训练提供数据支持。 read more
Refly By AiBard123 February 21, 2025 - 2 min read Refly是一个开源的AI创作引擎,提供直观的界面和多线程对话功能,助力内容生成。 read more
Local GRPO Training By AiBard123 February 20, 2025 - 2 min read Local GRPO培训是一个可在本地运行GRPO策略的工具,提供简单的配置和训练指引。 read more