AI文摘

blog-thum
大语言模型知识蒸馏最新综述!!

本文转自专知本综述深入探讨了大型语言模型(LLMs)领域内的知识蒸馏(KD)技术,突出了KD在将GPT-4等专有巨头的复杂能力转移至LLaMA和Mistral等可访问的开源模型中的关键作用。在不断演变

read more