AI 日报

20241023 Anthropic发布Claude 3.5新模型,具备计算机操作能力





🦉 AI新闻

🚀 Anthropic发布Claude 3.5新模型,具备计算机操作能力

摘要:10月22日,Anthropic推出了Claude 3.5 Sonnet和Claude 3.5 Haiku,升级版Sonnet具备更强的编程能力及“计算机使用”新功能,能模拟人类与计算机的交互。这一进展标志着AI代理技术的演变,尽管其在执行任务时表现不够可靠,仍吸引了用户关注。Anthropic希望通过逐步开放安全模型,改善AI代理的可靠性与安全性。

🚀 微软前研究经理谭旭加入大模型创业公司月之暗面

摘要:微软亚洲研究院前首席研究经理谭旭于8月加盟创业公司月之暗面,负责研发端到端语音模型。该公司早在去年10月已启动多模态研究,目前有约10人团队致力于视频模型开发。谭旭的目标之一是为月之暗面打造“类似GPT-4o”的语音体验,旨在提升机器响应速度,并减少人机交互的自然差距。此前,主流语音处理方案存在响应延迟问题,而端到端技术可减少中间环节。

🚀 微软发布10个AI Agent,加剧SaaS市场竞争

摘要:微软近日发布10个AI Agent,主要应用于Dynamics 365,旨在提升销售、服务、财务和供应链团队的业务效率。这些智能体将于11月提供公众预览版,同时推出Copilot Studio工具,支持用户自定义和管理Agent。此次发布加剧了微软与Salesforce在SaaS AI市场的竞争。市场反映显示,60%的财富500强企业已采用微软Copilot,利用AI技术提升工作效率,进一步推动业务成果。

🚀 Midjourney发布全新AI图像编辑器工具

摘要:Midjourney首席执行官David Holz在Discord上宣布,计划于下周推出一款全新的AI图像编辑器工具。用户可以在上传图像后,通过简单命令进行放大、缩小和调整角度等操作。同时,该编辑器支持数字画笔修补,能够基于上传图像的深度信息生成新图片。与现有工具不同,Midjourney的编辑器允许编辑其他AI生成的图像,这可能引发伦理风险,Holz表示公司将采取限制部署和增加人类审核机制以确保使用安全。

🚀 多智能体系统将成AI发展新趋势

摘要:近期OpenAI和谷歌发布多智能体招聘信息,预示着AI发展的新阶段。多智能体系统由多个相互交互的自主智能体组成,具备特定的专长,比单体大语言模型(LLM)更具效率与灵活性。OpenAI与谷歌均在研究这一领域,旨在自动化复杂任务,推动AGI进程。多智能体系统将助力实现智能城市、清洁能源及精准医疗等实际应用,展现出更强的扩展性和鲁棒性。

🚀 IBM发布Granite 3.0系列AI模型

摘要:IBM在TechXchange活动上推出Granite 3.0系列AI模型,表现出色,适用于多种任务,如分类及实体提取。该系列包括多种新模型,强调企业AI的稳健性和可靠性。模型现已在HuggingFace平台提供下载,并可通过Watsonx平台商业使用。开发者可利用Visual Studio Code扩展提升代码能力。IBM还计划明年推出更多智能体AI相关内容,进一步推动AI领域的发展。

🚀 英伟达发布新架构nGPT 提升AI训练效率

摘要:英伟达近日发布了Normalized Transformer(nGPT)新架构,在保持模型稳定性和准确性的基础上,大幅缩短AI训练时间至原来的1/4或1/20。nGPT采用“超球面学习”理念,通过将关键组件映射到超球面上,实现更高效的学习过程,减少训练步骤,简化过程。测试显示,nGPT在速度和效率上都优于传统GPT模型,未来可能与其他模型整合,推动更强大的AI系统的发展。

更多AI工具 Github-AiBard123

可关注我们的公众号:每天AI新工具

广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:1752338621