AI文摘

blog-thum
高级RAG检索策略之递归检索

随着LLM(大语言模型)技术的发展,RAG(Retrieval-AugmentedGeneration)技术在问答、对话等任务中的应用越来越广泛。RAG技术的一个重要组成部分是文档检索器,它负责

read more
blog-thum
深度探索StableDiffusion模型推理加速

大模型时代,模型的参数量动辄数十亿甚至千亿,比如GPT-3的参数量达到了1750亿。1750亿个参数,如果采用fp16存储,那么模型的大小约为3255G,现有最强的计算平台也很难满足其显存要求。此外

read more