20250122 谷歌将发布升级版Gemini 2.0 AI模型 🦉 AI新闻 🚀 谷歌将发布升级版Gemini 2.0 AI模型摘要：据报道，谷歌即将于1月23日发布升级版Gemini AI模型“Gemini 2.0 Flash Thinking Exp-0123”，该模型在现有“Exp-1219”基础上具备更先进的功能。其特色在于生成思考过程，提高A

20250122 谷歌将发布升级版Gemini 2.0 AI模型

By AiBard123
January 22, 2025 - 2 min read

🦉 AI新闻

🚀 谷歌将发布升级版Gemini 2.0 AI模型

摘要：据报道，谷歌即将于1月23日发布升级版Gemini AI模型“Gemini 2.0 Flash Thinking Exp-0123”，该模型在现有“Exp-1219”基础上具备更先进的功能。其特色在于生成思考过程，提高AI推理的透明度，类似于OpenAI的“慢思考”方式，增强快速决策能力。该模型可能集成到Google AI Studio，为开发者和研究人员提供更强大的工具。

🚀 腾讯开源混元3D生成大模型2.0

摘要：腾讯宣布开源混元3D生成大模型2.0，并推出业界首个一站式3D AI创作引擎。该技术可通过简单的文字或图片输入生成3D模型，同时支持动作、纹理和人物的调整。新版本在几何和纹理两大模型上进行了升级，优化了生成效果，特别适合游戏开发和UGC创作。开发者可在技术社区下载相关模型，用户可申请体验新功能。

🚀 OpenAI探讨为ChatGPT添加记忆功能

摘要：IT之家报道，OpenAI公司正在探索为ChatGPT整合Memory记忆功能，以提升其搜索能力，提供更个性化的用户体验。该功能目前处于隐藏状态，一旦启用，ChatGPT将能够利用用户的历史互动，检索相关信息，给出更精确的回答。这类功能类似于网络浏览中的Cookie，但也可能引发隐私和定向广告的讨论。

🚀 微软与OpenAI调整合作关系，允许其使用竞争对手算力

摘要：微软于1月21日宣布调整与OpenAI的合作，允许后者使用竞争对手的计算资源，以满足其日益增长的算力需求。这一变化旨在缓解双方因算力供应问题引发的摩擦。OpenAI现在可以从其他供应商获取算力，同时微软保留优先购买权。尽管算力排他性有变，但双方的合作基础保持不变，微软依然保留OpenAI技术在产品中的独家使用权。

🚀 MiniMax推出全新T2A-01系列语音模型

摘要：MiniMax于1月20日发布升级的T2A-01系列语音模型，全球同步上线海螺语音产品。用户可通过输入文字生成自然流畅的人声，最长支持10000字符。该产品支持17种语言，具备情感理解能力，自能识别和重现语音中的情感差别，提供300多种音色选择，适用于有声书、耳语、新闻播报等多场景。

🚀 美图WHEE推出AI海报功能支持中文字体

摘要：美图WHEE近日宣布将推出「AI海报」功能，用户只需一句话即可生成多种海报，且支持中文字体。该功能涵盖电影、电商、自媒体及线下活动四大场景，提供多样化的定制模板和灵活排版。WHEE于2023年6月发布，是一款面向普通用户及专业创作者的在线AI视觉创作工具，提供文生图、图生图等多种AIGC图像服务。

🚀 阶跃星辰发布Step-2系列新语言模型

摘要：阶跃星辰于1月21日推出Step-2系列新语言模型，包括小巧高效的Step-2 mini和针对内容创作的Step-2文学大师版。Step-2 mini在保留80%性能的同时，参数量仅为万亿参数大模型的3%，具备更快生成速度和性价比。其独特的MFA架构显著节省了KV缓存开销。Step-2文学大师版则专注于提升内容创作能力，旨在解决现有模型内容缺乏创意和真实情感的问题。

🚀 OpenAI即将推出“Operator” AI功能

摘要：科技媒体报道，OpenAI将在macOS版ChatGPT应用中推出名为“Operator”的新AI功能，该功能将充当自主智能体，自动执行包括编码、网页浏览和旅行预订等任务。用户可通过应用中的快捷方式切换这一功能，Operator将利用macOS的辅助功能API与屏幕内容互动，并分析开发者工具中的代码。此功能旨在无需用户输入即可完成任务，且可能正在与其他AI工具进行基准测试。

更多AI工具 Github-AiBard123

可关注我们的公众号：每天AI新工具

广告：私人定制视频文本提取，字幕翻译制作等，欢迎联系QQ:1752338621