鱼羊发自凹非寺量子位公众号QbitAI微软大模型新架构,正式向Transformer发起挑战!论文标题明晃晃地写道:RetentiveNetwork(RetNet):大模型领域Trans
read more西风发自凹非寺量子位公众号QbitAI最近Claude2亮相、谷歌Bard支持中文、OpenAI推出CodeInterpreter(代码解释器)……大模型发布一波接着一波,但五花八门
read more丰色发自凹非寺量子位公众号QbitAI现有大语言模型的训练和推理速度,还能再快一点——快多少?2-4倍。各种大模型都在用的FlashAttention今天正式发布第2代并开源,所有Tran
read moreMichaelLiu投稿量子位公众号QbitAI最近和大模型一起爆火的,还有大模型的微调方法。这类方法只用很少的数据,就能让大模型在原本表现没那么好的下游任务中“脱颖而出”,成为这个任务的
read more机器之心报道编辑:梓文当你使用AI编码助手的时候会遇到什么困难?它是不是让你又爱又恨?本文介绍的Chapyter将目前火爆的ChatGPT代码解释器与JupyterNotebook结
read more新智元报道 来源:CLUE中文语言理解测评基准编辑:好困桃子【新智元导读】70亿参数模型发布后短短26天,百川智能便开源了号称最强的中英文130亿参数模型——Baichuan-13B。那么真实性能
read more