LLM Twin Course By AiBard123 April 1, 2024 - 2 min read 免费课程,向你展示如何设计、训练和部署一个准备就绪的生产标准的 LLM(大型语言模型) read more
SSM-Transformer By AiBard123 March 29, 2024 - 2 min read AI21推出了首个生产级别的基于Mamba的模型Jamba,这是一个创新的SSM-Transformer混合架构模型 read more
Qwen1.5-MoE By AiBard123 March 29, 2024 - 2 min read 阿里巴巴一款小型 MoE 模型,只有 27 亿个激活参数,但性能与最先进的 7B 模型(如 Mistral 7B 和 Qwen1.5-7B)相匹配 read more