20240515 谷歌I/O 2024大会全面硬刚OpenAI 🦉 AI新闻 🚀 谷歌发布升级版Gemini机器人竞争OpenAI ChatGPT-4 摘要：谷歌展示了升级版的 Gemini 聊天机器人，其支持实时处理视频和语音输入，并准确回答问题。此次发布时机与 OpenAI 公布 ChatGPT-4o 新模型几乎同步。Gemini 的多模态能力和自然对话让人们看到了未来 AI 交互

20240515 谷歌I/O 2024大会全面硬刚OpenAI

By AiBard123
May 15, 2024 - 2 min read

🦉 AI新闻

🚀 谷歌发布升级版Gemini机器人竞争OpenAI ChatGPT-4

摘要：谷歌展示了升级版的 Gemini 聊天机器人，其支持实时处理视频和语音输入，并准确回答问题。此次发布时机与 OpenAI 公布 ChatGPT-4o 新模型几乎同步。Gemini 的多模态能力和自然对话让人们看到了未来 AI 交互的潜力。

🚀 谷歌 Chrome 126 引入本地文本生成功能

摘要：谷歌在 I / O 2024 开发者大会上宣布，Chrome 126 浏览器将引入本地文本生成功能 Gemini Nano，用户可直接生成产品评论、社交媒体帖子等内容。与微软 Edge 的 Copilot 不同，Gemini Nano 在设备本地运行。此外，Chrome DevTools 将提供 Gemini 功能，帮助开发者调试应用程序并提供编码建议。

🚀 谷歌推出Gemini个性化助手功能Gems

摘要：2024年5月15日，谷歌在I/O开发者大会上发布Gemini的个性化选择“Gems”，用户可通过Gems定制Gemini助理角色。该功能允许用户创建具备特定特征的聊天机器人，以帮助完成各种任务，如健身伴侣、副厨师、编码助手、创意写作指导等。Gems类似于OpenAI的GPT Store和Character.AI，提供丰富的定制交互体验。

🚀 谷歌升级安卓端Gemini，提升内容理解和分析能力

摘要：谷歌在I/O 2024开发者大会上宣布将升级安卓端Gemini工具，使其更好地理解屏幕内容并分析数据，为用户提供建议。新版本还可通过视频自动字幕答疑，支持PDF文件内容总结。该功能为Google One AI Premium计划的一部分，月费为20美元。

🚀 谷歌推出Project Astra多模态AI项目

摘要：在2024年I/O开发者大会上，谷歌发布了基于Gemini的多模态AI项目——Project Astra。该项目能够本地运行在Pixel手机上，用户通过摄像头可以直接解释画面中的物品。谷歌用视频演示了其识别物品、记忆位置及解释代码的功能，展示了该技术的强大能力。

🚀 谷歌推出高速高效的Gemini 1.5 Flash模型

摘要：2023年5月15日，谷歌宣布推出新的Gemini 1.5 Flash模型，重点优化速度和效率。该模型适用于摘要、聊天应用、图像和视频字幕等任务，并能处理大规模数据。通过“蒸馏”过程，Flash模型在保留Pro版本功能的同时，更轻便和经济，适合开发者构建AI产品。

🚀 谷歌升级Gemini 1.5 Pro模型，提升上下文窗口至200万tokens

摘要：在2024年I/O开发者大会上，谷歌宣布将Gemini 1.5 Pro模型的上下文窗口从100万tokens提升至200万，使其能够处理更大量的数据，如2小时视频、22小时音频等。谷歌CEO皮查伊表示，Gemini时代将为创造者和开发者带来更多机遇。目前，150多万开发者使用Gemini模型，服务覆盖20亿用户。

🚀 谷歌推出AI Overviews搜索体验

摘要：谷歌在2024年 I/O 开发者大会上推出“AI Overviews”搜索体验，将于本周开始在美国开放，并逐步推广至更多国家。该功能旨在通过提问和聊天方式进行 AI 搜索。谷歌首席执行官表示，此更新为搜索引擎25年来最大更新之一。AI Overviews 主要与 Reddit 社区合作，解答用户提问。

🚀 谷歌I/O大会展示AR眼镜Project Astra

摘要：在今天召开的谷歌I/O开发者大会上，谷歌展示了Project Astra项目并意外展示一款AR眼镜。视频演示中，AR眼镜通过摄像头、麦克风和扬声器与演示者互动。这款眼镜设计简约，功能完善，但具体细节未公开。

🚀 谷歌将在Gmail中集成Gemini AI功能

摘要：在2024年5月15日的谷歌I/O开发者大会上，谷歌宣布将邀请Workspace和Google One AI Premium用户下月体验新版Gmail，其中集成了Gemini AI。用户可在移动和网页版Gmail中使用Gemini总结邮件内容、提问或撰写回复。新版还将引入“Contextual Smart Reply”和新的Gemini按钮，提供邮件总结和回复建议功能。

🚀 谷歌 I / O 2024：Workspace 将整合 Gemini

摘要：谷歌公司宣布在 I / O 2024 开发者大会上进一步整合 Gemini 技术，将在 Workspace 的侧面板中推出 Gemini 1.5 Pro 的多个技能。此举旨在节省用户在多个应用间搜索数据的时间和精力。Gmail、Docs、Sheet、Slides 和 Drive 将首先使用该功能，以便在应用内直接组织和理解数据，实现如邮件总结和会议记录摘要等功能。

🚀 谷歌引入AI诈骗电话检测功能

摘要：谷歌在I/O 2024开发者大会上宣布为安卓系统引入AI诈骗电话检测功能，该功能基于Gemini Nano模型本地运行，识别和提醒可能的诈骗行为，确保通话私密性。功能需用户手动启用，谷歌将在今年晚些时候分享更多详细信息。

🚀 谷歌推出Gemini旅行规划功能

摘要：谷歌在2024 I/O开发者大会上宣布为Gemini引入旅行规划功能，结合个人信息和公共出行信息，帮助用户快速规划预订航班、酒店等行程。用户可根据后期提示动态调整。该功能将在未来几个月内登陆Gemini Advanced。

##### 🚀 腾讯混元文生图大模型开源发布

摘要：5月14日，腾讯宣布旗下混元文生图大模型升级并开源，现已在Hugging Face和Github上发布，包含模型权重、推理代码、模型算法等。混元DiT是首个中英双语DiT架构，支持中英文细粒度理解能力，最低显存需求11GB。首批通过国内官方“大模型标准符合性评测”的国产大模型还包括阿里通义千问、360智脑和百度文心一言。

🚀 Meta开发带摄像头AI耳机力争市场先机

摘要：Meta正研发名为Camerabuds的AI耳机，具备识别物体和翻译外语功能，但仍面临设计挑战如摄像头被遮挡和续航不足等问题。扎克伯格已尝试多种设计，但均不满意。目前Meta领导层希望加快研发以应对竞争。其他科技公司如Humane和Rabbit也在开发类似设备，但因订阅费和“套壳”问题备受质疑。

🚀 OpenAI推出新AI模型GPT-4o，登顶机器人竞技场

摘要：OpenAI 员工 William Fedus 证实，新发布的 AI 模型 GPT-4o 在 LMSYS 聊天机器人竞技场表现优异，登顶排行榜。GPT-4o 以“gpt-chatbot”为名测试，取得最高分。多方消息称，该模型大幅领先此前冠军 Claude 3 Opus 和 GPT-4 Turbo。竞技场是用户与随机 AI 对话并选择最佳回复的平台。

更多AI工具，参考国内AiBard123，Github-AiBard123

可关注我们的公众号：每天AI新工具

广告：私人定制视频文本提取，字幕翻译制作等，欢迎联系QQ:1752338621