【点击】加入大模型技术交流群大家好哇,好久没有更新了,今天想来讲讲FlashAttention(V1)。不知道你有没有和我一样的感受,第一次读FlashAttention的论文时,感觉头懵懵的:它
read more本文我们将尝试AutoGen集成函数调用功能。函数调用最早出现在OpenAIAPI中,它允许用户调用外部API来增强系统的整体功能和效率。例如,在对话过程中根据需要调用天气API。 函数
read more【点击】加入大模型技术交流群本文借助llama这个模型快速入门LLM的推理过程,很多技术细节都是通用的,也适合其他的LLM。这篇也算是总结的性质,仅需要的知识点都列出来,简单介绍一番。可能说的不够详细
read more新智元报道 编辑:编辑部【新智元导读】机器人的ChatGPT时刻,真来了!初创公司Figure自家机器人看了10小时视频,学会了煮咖啡。另一边,东京大学GPT-4加持的Alter3机器人,能够模仿人
read more作为算法工程师的你是否对如何应用大型语言模型构建医学问答系统充满好奇?是否希望深入探索LLaMA模型的微调技术,进一步优化参数和使用不同微调方式?现在笔者会带你领略大模型训练与微调进阶之路,拓展您的技
read more在这个信息爆炸的时代,PPT已成为表达思想和分享知识的重要工具,特别是马上年底了,每个公司每个业务线都需要做各种工作汇报。然而,很多人在制作PPT时,不仅耗费大量时间和精力,还常常感到灵感枯竭。幸运的
read more