AI新工具

blog-thum
LLM Twin Course

免费课程,向你展示如何设计、训练和部署一个准备就绪的生产标准的 LLM(大型语言模型)

read more
blog-thum
SSM-Transformer

AI21推出了首个生产级别的基于Mamba的模型Jamba,这是一个创新的SSM-Transformer混合架构模型

read more
blog-thum
Grok-1.5

具备更强的推理能力和128,000词元的上下文长度,即将在𝕏平台提供

read more
blog-thum
Qwen1.5-MoE

阿里巴巴一款小型 MoE 模型,只有 27 亿个激活参数,但性能与最先进的 7B 模型(如 Mistral 7B 和 Qwen1.5-7B)相匹配

read more