AI 文摘

20240202大模型进展早报—AI搜索、RAG、MOE、Agent、长文本之2024年1月大模型技术总结





作者: 老刘说NLP 来源: 老刘说NLP

今天是202年2月2日,星期五,北京,晴。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

现在老刘说NLP社区新增每日大模型早报模块,回顾前一天大模型相关进展,欢迎大家关注社区 。‍‍‍‍‍‍‍‍‍

文字版:【老刘说NLP技术社区2024年2月2日大模型早报】

1,面壁智能开源2B旗舰级端侧多模态模型MiniCPM :https://github.com/OpenBMB/MiniCPM,https://github.com/OpenBMB/OmniLMM。

2,PyTorch也迎来重大更新,PyTorch 2.2集成了FlashAttention-2和AOTInductor等新特性,计算性能翻倍 :https://pytorch.org/blog/pytorch2-2/

3,Meta正式发布Code Llama 70 :https://ai.meta.com/research/publications/code-llama-open-foundation-models-for-code/,包括三个模型:CodeLlama - 70B:基础代码模型、CodeLlama - 70B - Python:专门针对Python的 70B模型、CodeLlama - 70B - Instruct:专门用于理解自然语言指令的模型。

4,小红书开源出片开源模型InstantID,根据用户照片快速生成写真 ,论文地址:https://arxiv.org/abs/2401.07519,主页:https://instantid.github.io/,Demo 尝鲜:https://huggingface.co/spaces/InstantX/InstantID

5、字节跳动正式推出Coze 扣子AI Bot 开发平台 。任何用户都可以快速、低门槛地搭建自己的 Chatbot,且平台支持用户将其一键发布到飞书、微信公众号、豆包等渠道:https://www.coze.cn/

6、多模态大模型llava-1.6B,更新 :

https://llava-vl.github.io/blog/2024-01-30-llava-1-6/,demo 地址:https://llava.hliu.cc/,

项目地址:https://github.com/haotian-liu/LLaVA

今天是2024年2月2日,2024年第一个月已经过去 ,老刘说NLP社区顺利完成2024第二讲:《AI搜索、Agent、长文本等2024年1月大模型总结-兼谈碎片化时代如何高效学习?》,面向全体社区成员,聊了聊一些有趣的话题,有趣的见闻,有趣的方案,有趣的坑,以及未来的一些建设性意见。

86页PPT、7个主题,2小时知识密集型分享,支持回放。

我们主要回顾了2024年一月份大模型产品应用、大模型微调、评估、agent、大模型幻觉、RAG问答(模块化的RAG,RAG上下文压缩),知识图谱+RAG的一些事儿 ,当然,也包括值得关注的一些开源项目、一些方向。

ps.报告针对全体社区成员开放,加入会员方式:关注公众号,在后台菜单栏中点击会员社区->会员入群加入。

总结,总结,再总结,是提升我们对一些技术、产品等认知的必备路径,让我们一起加入进来,更技术导向地进步,下面是本次线上交流中的部分内容 :‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

关于1月大模型产品动态( 部分) ‍‍‍‍‍‍

关于moe(部分)

关于知识图谱&幻觉(部分) ‍‍‍‍‍‍‍‍

关于RAG (部分) ‍‍‍‍‍‍‍‍‍‍

关于AI搜索(部分) ‍‍‍‍‍

关于长文本(部分) ‍‍

关于agent(部分) ‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

关于高效学习(部分) ‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

更多….尽在线上分享(ps.报告针对全体社区成员开放,加入会员方式:关注公众号,在后台菜单栏中点击会员社区->会员入群加入)

关于我们

老刘,刘焕勇,NLP开源爱好者与践行者,主页:https://liuhuanyong.github.io。

老刘说NLP,将定期发布语言资源、工程实践、技术总结等内容,欢迎关注。

对于想加入更优质的知识图谱、事件图谱、大模型AIGC实践、相关分享的,可关注公众号,在后台菜单栏中点击会员社区->会员入群加入。

更多AI工具,参考Github-AiBard123国内AiBard123

可关注我们的公众号:每天AI新工具