AI 文摘

智猩猩AI智能体技术研讨会最终议程公布!6位学者和开发大牛现场解读AI智能体内涵





作者: 老刘说NLP 来源: 老刘说NLP

自ChatGPT面世以来,生成式AI加速狂飙,在学术界、产业界、投资界掀起滔天巨浪,冲击着千行百业。

AI大模型飞速迭代,创新应用层出不穷。我们正处于技术野蛮生长的爆发时刻,见证着AI向通用人工智能全速冲刺的破竹之势。

值此之际,由智一科技旗下智东西联合智猩猩发起主办的2024中国生成式AI大会 (GenAICon 2024)将于4月18日-19日北京JW万豪酒店 举办。本届大会的主题为**“重构世界 奔赴未来”** ,将以前瞻性视野全景式解构生成式AI的时与势、危与机、破与立。

大会日程分为两天,由“主会场峰会、分会场研讨会与论坛、展览、榜单”组成。其中,主会场第一日将进行开幕式、大模型专场,第二日将进行AI Infra专场、AIGC应用专场;分会场第一日下午将进行智猩猩具身智能技术研讨会(收费制),第二日上下午分别进行智猩猩AI智能体技术研讨会(收费制)、以及中国智算中心创新论坛。「AI生产力创新先锋-中国生成式AI企业TOP50」榜单于第二日上午最终揭晓。

AI 智能体(AI Agent)的话题是时下整个人工智能领域的关注焦点。人工智能著名学者、斯坦福大学教授吴恩达更是在近期指出,AI 智能体工作流将在今年推动人工智能取得巨大进步,甚至可能超过下一代基础模型。

但是,尽管概念炒得火热,一个 AI 智能体的具体内涵究竟应该是怎样的,绝大多数人并没有一个清晰的认知。

在此背景下,智猩猩AI智能体技术研讨会邀请到6位来自学术界和工业界的学者和开发大牛,通过主题报告、圆桌Panel两种形式进行深入解读。

DeepWisdom合伙人、MetaGPT核心成员徐宗泽 ,将从智能体的演变、MetaGPT的崛起等四个方面解析构建企业AI基建的精髓;腾讯公司研究科学家张驰 将展示团队在多模态大模型领域的探索成果AppAgent,并展望基于GUI的Agent发展前景;随着多模态技术的不断发展,AI智能体技术将迎接更加复杂多样化的交互场景,阿里巴巴通义实验室算法专家李晨亮 将介绍开源框架ModelScope-Agent如何加快多智能体的交互开发;实在智能合伙人&核心算法负责人欧阳小刚 将全面剖析数字员工从RPA到Agent的进阶历程与案例,并预见数字员工技术的未来发展。

清华大学自然语言处理实验室(THUNLP)博士后、清华大学水木学者钱忱 于2023年领导并发布了大模型智能体协作式软件开发框架ChatDev,并多次登顶Github Trending榜。钱忱博士将在报告中,探讨自主智能体的设计思路、群体协作框架、经验积累等关键技术,为基于大语言模型实现群体智能自动化愿景提供初步思路。

圆桌Panel由出品人李晨亮主持,张弛、欧阳小刚以及清华大学计算机系博士生、LLaVA-Plus⼀作刘世隆 将参与讨论。

智猩猩AI智能体技术研讨会为2024中国生成式AI大会期间于第二日上午举行的一场收费制会议,主要面向大会购票用户开放。划重点啦!!!目前标准票(通票)尚有少量余票,如有需求,可以扫描底部研讨会议程海报上的二维码,添加小助手泡泡进行咨询和购买。

研讨会嘉宾及报告介绍

**1、**DeepWisdom合伙人、MetaGPT 核心成员 徐宗泽

徐宗泽,DeepWisdom合伙人之一,团队AgentOS事业部经理。美国佩斯大学企业分析硕士,河海大学(在读)博士;在DeepWisdom负责包括电力、零售、金融等多个领域的AI Infra的应用落地;拥有数千万级AI Infra能源项目实践落地经验,MetaGPT团队核心成员。

主题:****《智能体的崛起与AI基建的重要性》

概要:

随着技术的飞速发展,智能体已经成为AI领域的热门话题,尤其是MetaGPT的出现,使得多智能体协同成为可能。但在这火热的趋势背后,企业如何确保自己的AI基建稳固,成为了一个亟待解决的问题。

本次演讲将从智能体的定义与发展历程、MetaGPT的涨速与影响、多智能体协同的新范式以及AI Infra的核心要素四个方面进行深入探讨。听众将了解到智能体的最新发展趋势,理解AI基建的重要性,并掌握如何为企业构建稳固的AI基建的策略和方法。

**2、**腾讯研究科学家 张驰

张驰博士,现就职于腾讯公司担任研究科学家。2021年博士毕业于新加坡南洋理工大学计算机学院。他的博士研究课题专注于高效低成本的机器学习和计算机视觉算法,目前的研究方向是大模型时代下的多模态模型与AIGC模型。曾在CVPR、ICCV、NeurIPS、TPAMI等顶级国际会议期刊上发表多篇学术论文。

主题:****《基于多模态大语言模型的GUI智能体》

概要:

如果将语言大模型比喻成一个能思考能交流的大脑,多模态语言大模型则是给大脑赋予了眼睛,让它能够像人一样看到世界。本次报告我将介绍团队在多模态大模型方向的努力与尝试。我将重点介绍我们最近在多模态智能体(Agent)方向的研究成果AppAgent:让图文大模型像人一样操作手机App,并探讨基于GUI的Agent未来的发展方向与应用前景。

**3、**阿里巴巴通义实验室算法专家 李晨亮

李晨亮,现为阿里巴巴通义实验室算法专家。2019年硕士毕业于北京邮电大学。主要研究方向为自然语言处理,包括预训练语言模型、文本生成、多模态等。曾经在相关领域顶级会议如ACL、EMNLP、AAAI,ICML等发表多篇预训练大模型相关论文,包括AliceMind系列的PALM,PLUG,mPLUG,中文GPT等系列生成模型。参与多个国际评测和比赛,在纯文本生成、多模态生成等相关评测榜单上多次达到第一,并在多模态VQA榜单上首次超越人类水平。负责ModelScopeGPT项目,打造大小模型协同的agent系统和基于开源大模型的ModelScope-Agent框架。

主题:****《开源框架ModelScope-Agent加速多智能体应用构建》

概要:

ModelScope-Agent 是一个强大且灵活的开源框架,专门设计给开发者快速打造单智能体和多智能体应用。它除了支持大部分的闭源大模型API调用之外,更重要的是结合魔搭开源社区,集成了很多开源大模型和训练微调方案,用户可以快速在开源大模型上做微调进一步提升智能体效果。无论是在模拟环境中进行复杂任务的协作学习还是在实际应用中整合多个智能决策模块,ModelScope-Agent 都提供了必需的工具和接口,从而简化了多智能体交互的开发过程,并充分利用大模型的潜力。基于这个框架,也推出了很多应用参考,如魔搭GPT,Story Agent和APP Fabric等。

**4、**清华大学自然语言处理实验室(THUNLP)博士后、ChatDev第一作者 钱忱

钱忱,清华大学自然语言处理实验室(THUNLP)博士后,清华大学水木学者,主要研究方向为自然语言处理、大模型群体智能;合作导师为孙茂松和刘知远教授,曾在人工智能、信息管理、软件工程等相关的国际学术会议或期刊上以第一作者身份发表论文数篇。于2023年领导并发布大模型智能体协作式软件开发框架ChatDev,并多次登顶Github Trending榜。

主题:****《大语言模型驱动的多智能体协作式软件开发》

概要:

随着人工智能技术的不断发展,未来的软件工程领域将发生根本性变革。在传统软件开发中,团队成员需要相互交流、协商和理解,以共同制定项目方案和编写代码。然而,随着大语言模型的出现,可以利用其强大的自然语言处理和生成能力,实现软件智能体的定制和高效协作。通过智能体间的自主交互,群体成员可以生成代码、提供建议,并协同优化软件源代码。

本次分享内容将探讨自主智能体的设计思路、群体协作框架、经验积累等关键技术,旨在基于大语言模型实现群体智能自动化愿景提供初步思路。

**5、**实在智能合伙人&核心算法负责人 欧阳小刚

欧阳小刚,实在智能合伙人&核心算法负责人,清华大学工学学士和工学硕士、硕士研究生学历,36氪 X-36 Under 36 S级青年创业者代表;曾任阿里巴巴资深算法工程师,在计算机视觉和自然语言处理领域有多年的深入研究和丰富的项目经验,尤其在光学字符识别、对话机器人构建、文本信息抽取等方向有深入的研究,并拥有多项授权发明专利及国内外核心期刊论文;曾负责云上贵州、珀莱雅、中国电信、中国烟草、平安国际等客户项目的服务落地。

主题:****《数字员工再进阶:实在Agent-超越自动化,迈向智能化》

概要:

随着大模型等AI技术的崛起,数字员工迎来新的技术革新。

本次演讲,将系统回顾RPA到Agent数字员工的进阶历程,介绍其如何逐步从简单的流程自动化走向更为智能的决策与交互;并将探讨当下Agent在办公自动化场景中的应用可能面临的痛点及挑战。此外,针对这些问题,我们将深入讲解实在Agent数字员工的服务架构,思考如何构建高效、灵活且安全的系统,以满足不同企业的需求。同时,我们还将分享实在Agent数字员工的典型应用案例,展示其在提升工作效率、优化业务流程方面的卓越表现。

在数字化转型的道路上,实在Agent数字员工将是我们不可或缺的重要伙伴。最后,我们将展望可持续研究的方向,思考如何结合人工智能技术的最新进展,推动数字员工技术的不断创新与发展。

6、清华大学计算机系博士生、LLaVA-Plus 一作刘世隆

刘世隆,清华大学计算机系博士生。曾在粤港澳大湾区数字经济(IDEA) 研究院、微软雷德蒙德研究院实习。长期关注物体理解、计算机视觉和多模态感知任务。曾获评2023 CCF-CV学术新锐学者,受邀参加2024 KAUST AI rising star symposium. DAB-DETR, DINO等多篇文章被paperdigest评为ICLR/CVPR最有影响力论文。google scholar引用超过2900,累积 Github stars 超过20k。

研讨会完整议程

更多AI工具,参考Github-AiBard123国内AiBard123

可关注我们的公众号:每天AI新工具