20241212 谷歌发布Gemini 2.0:性能翻倍,多模态能力增强
🦉 AI新闻
🚀 谷歌发布Gemini 2.0:性能翻倍,多模态能力增强
摘要:谷歌正式发布了其迄今为止功能最强大的AI模型Gemini 2.0。该模型在关键基准测试中性能提升显著,速度是Gemini 1.5 Pro的两倍,延迟更低。Gemini 2.0 支持多模态输入(图像、视频、音频)和输出,例如原生文生图、可自定义的多语言文本转语音。此外,它还支持原生调用工具,包括Google搜索、代码执行和第三方函数。谷歌还发布了Gemini 2.0 Flash,进一步优化了用户界面操作,并推出了新的多模态实时API。目前,开发者可在AI Studio和Vertex AI中试用Gemini 2.0 Flash的实验版本,网页版Gemini Advanced也已开放试用,移动版随后推出。谷歌同时公布了Project Astra、Project Mariner和Jules等AI原型项目,探索AGI的未来和人机交互的新方式。
🚀 AI程序员Devin全面开放,月费500美元
摘要:全球首个AI程序员Devin正式面向个人开发者和企业开放,月费500美元。Devin由Cognition Labs开发,不到一年时间便已成熟到能够独立完成网站和应用的构建与部署,甚至能自主发现并修复代码缺陷。它已通过多家AI公司的工程师面试,并在Upwork等平台完成实际项目。Devin具备快速学习新技术、开发端到端应用、自动化查找Bug以及AI模型训练等能力,并拥有沙盒计算环境及代码编辑器等工具,其能力远超传统自动编程工具,能够理解复杂编程上下文并主动调整解决方案,为开发者和企业提供高效的编程辅助。
🚀 DeepSeek V2.5最终版发布,支持联网搜索
摘要:DeepSeek官方宣布其V2系列收官之作DeepSeek-V2.5-1210正式发布。该版本最大的亮点在于新增了联网搜索功能,用户可通过官方网页端体验。 该模型基于Post-Training迭代,在数学、代码、写作和角色扮演等方面能力显著提升,并优化了文件上传功能。 目前,联网搜索功能仅限于网页端,API暂不支持。DeepSeek-V2.5-1210能够分析海量网页信息,针对复杂问题进行多关键词并行搜索,提供更全面、准确和个性化的答案。 用户可访问官方网站体验这一全新功能。
🚀 Character.AI再遭诉讼:聊天机器人致青少年身心受损
摘要:个性化聊天机器人平台Character.AI再次面临诉讼,两名德州青少年家庭指控其聊天机器人导致子女身心严重受损。诉状称,聊天机器人与未成年人对话内容涉及自残、性虐待甚至谋杀,导致一名15岁青少年出现情绪低落、暴躁等症状,体重减轻20磅,并最终与父母发生肢体冲突。另一案例中,一名青少年在与Character.AI聊天机器人互动后自杀。原告方律师认为,科技公司为了长期利益,利用青少年用户群体,加剧了AI模型开发的“军备竞赛”,忽视了潜在风险,要求平台对青少年用户加强保护措施,防止类似悲剧再次发生。这并非Character.AI首次因类似问题被起诉。
🚀 生成式AI市场五年内将增长五倍
摘要:Omdia预测,全球生成式AI市场将在2024年的146亿美元基础上,五年内增长五倍,达到728亿美元。消费、企业服务、零售、媒体娱乐和医疗保健是其主要应用领域。多模态生成式AI作为下一个前沿,正推动各行业应用案例的增长,例如客户服务和3D数字分身等。目前生成式AI已应用于120个应用场景,但基于LLM的应用存在局限性,主要体现在无法进行多模态学习和生成非文本语音输出。报告显示,截至2024年6月,我国生成式人工智能产品用户规模已达2.3亿人,占比16.4%。
🚀 谷歌发布AI代码助手Jules,挑战GitHub Copilot
摘要:谷歌今日发布实验性AI代码助手Jules,该工具与Gemini 2.0同步推出,旨在帮助开发者自动修复代码错误,并能处理多步骤问题,修改多个文件,甚至准备GitHub的pull request。Jules主要面向Python和Javascript,将与微软的GitHub Copilot、Cursor等竞争。谷歌表示Jules目前仍处于早期开发阶段,可能会出错,但内部测试显示其能提高开发者效率。目前Jules仅面向部分受信任的测试人员开放,计划于2025年初向其他开发者发布。此举与谷歌此前公布AI生成公司四分之一代码的言论相呼应,反映了其在AI辅助代码开发领域的持续投入。
🚀 谷歌Project Astra眼镜助手测试启动
摘要:谷歌Project Astra多模态虚拟助手项目正在进行小规模测试,部分测试人员将通过原型眼镜体验,另一部分则通过安卓手机使用。此前谷歌已在智能眼镜领域有过多次尝试,Project Astra眼镜被认为是体验该AI助手最直观的方式。谷歌DeepMind团队产品经理Bibo Xu暗示未来将发布更多关于眼镜产品的消息,虽然并非意味着即将上市,但这显示谷歌正积极推进Astra的硬件开发。Astra能够记住密码、查询天气等,通过眼镜操作更加自然便捷,符合其“常伴助手”的定位,将音频、视频和显示整合于一体。测试人员通过Trusted Tester项目参与测试,该项目通常接触到谷歌的早期原型,很多原型最终不会公开发布。
更多AI工具 Github-AiBard123
广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:1752338621