20240202大模型进展早报—AI搜索、RAG、MOE、Agent、长文本之2024年1月大模型技术总结
作者: 老刘说NLP 来源: 老刘说NLP
今天是202年2月2日,星期五,北京,晴。
现在老刘说NLP社区新增每日大模型早报模块,回顾前一天大模型相关进展,欢迎大家关注社区 。
文字版:【老刘说NLP技术社区2024年2月2日大模型早报】
1,面壁智能开源2B旗舰级端侧多模态模型MiniCPM :https://github.com/OpenBMB/MiniCPM,https://github.com/OpenBMB/OmniLMM。
2,PyTorch也迎来重大更新,PyTorch 2.2集成了FlashAttention-2和AOTInductor等新特性,计算性能翻倍 :https://pytorch.org/blog/pytorch2-2/
3,Meta正式发布Code Llama 70 :https://ai.meta.com/research/publications/code-llama-open-foundation-models-for-code/,包括三个模型:CodeLlama - 70B:基础代码模型、CodeLlama - 70B - Python:专门针对Python的 70B模型、CodeLlama - 70B - Instruct:专门用于理解自然语言指令的模型。
4,小红书开源出片开源模型InstantID,根据用户照片快速生成写真 ,论文地址:https://arxiv.org/abs/2401.07519,主页:https://instantid.github.io/,Demo 尝鲜:https://huggingface.co/spaces/InstantX/InstantID
5、字节跳动正式推出Coze 扣子AI Bot 开发平台 。任何用户都可以快速、低门槛地搭建自己的 Chatbot,且平台支持用户将其一键发布到飞书、微信公众号、豆包等渠道:https://www.coze.cn/
6、多模态大模型llava-1.6B,更新 :
https://llava-vl.github.io/blog/2024-01-30-llava-1-6/,demo 地址:https://llava.hliu.cc/,
项目地址:https://github.com/haotian-liu/LLaVA
今天是2024年2月2日,2024年第一个月已经过去 ,老刘说NLP社区顺利完成2024第二讲:《AI搜索、Agent、长文本等2024年1月大模型总结-兼谈碎片化时代如何高效学习?》,面向全体社区成员,聊了聊一些有趣的话题,有趣的见闻,有趣的方案,有趣的坑,以及未来的一些建设性意见。
86页PPT、7个主题,2小时知识密集型分享,支持回放。
我们主要回顾了2024年一月份大模型产品应用、大模型微调、评估、agent、大模型幻觉、RAG问答(模块化的RAG,RAG上下文压缩),知识图谱+RAG的一些事儿 ,当然,也包括值得关注的一些开源项目、一些方向。
ps.报告针对全体社区成员开放,加入会员方式:关注公众号,在后台菜单栏中点击会员社区->会员入群加入。
总结,总结,再总结,是提升我们对一些技术、产品等认知的必备路径,让我们一起加入进来,更技术导向地进步,下面是本次线上交流中的部分内容 :
关于1月大模型产品动态( 部分)
关于moe(部分)
关于知识图谱&幻觉(部分)
关于RAG (部分)
关于AI搜索(部分)
关于长文本(部分)
关于agent(部分)
关于高效学习(部分)
更多….尽在线上分享(ps.报告针对全体社区成员开放,加入会员方式:关注公众号,在后台菜单栏中点击会员社区->会员入群加入)
关于我们
老刘,刘焕勇,NLP开源爱好者与践行者,主页:https://liuhuanyong.github.io。
老刘说NLP,将定期发布语言资源、工程实践、技术总结等内容,欢迎关注。
对于想加入更优质的知识图谱、事件图谱、大模型AIGC实践、相关分享的,可关注公众号,在后台菜单栏中点击会员社区->会员入群加入。
更多AI工具,参考Github-AiBard123,国内AiBard123