20250122 谷歌将发布升级版Gemini 2.0 AI模型

🦉 AI新闻
🚀 谷歌将发布升级版Gemini 2.0 AI模型
摘要:据报道,谷歌即将于1月23日发布升级版Gemini AI模型“Gemini 2.0 Flash Thinking Exp-0123”,该模型在现有“Exp-1219”基础上具备更先进的功能。其特色在于生成思考过程,提高AI推理的透明度,类似于OpenAI的“慢思考”方式,增强快速决策能力。该模型可能集成到Google AI Studio,为开发者和研究人员提供更强大的工具。
🚀 腾讯开源混元3D生成大模型2.0
摘要:腾讯宣布开源混元3D生成大模型2.0,并推出业界首个一站式3D AI创作引擎。该技术可通过简单的文字或图片输入生成3D模型,同时支持动作、纹理和人物的调整。新版本在几何和纹理两大模型上进行了升级,优化了生成效果,特别适合游戏开发和UGC创作。开发者可在技术社区下载相关模型,用户可申请体验新功能。
🚀 OpenAI探讨为ChatGPT添加记忆功能
摘要:IT之家报道,OpenAI公司正在探索为ChatGPT整合Memory记忆功能,以提升其搜索能力,提供更个性化的用户体验。该功能目前处于隐藏状态,一旦启用,ChatGPT将能够利用用户的历史互动,检索相关信息,给出更精确的回答。这类功能类似于网络浏览中的Cookie,但也可能引发隐私和定向广告的讨论。
🚀 微软与OpenAI调整合作关系,允许其使用竞争对手算力
摘要:微软于1月21日宣布调整与OpenAI的合作,允许后者使用竞争对手的计算资源,以满足其日益增长的算力需求。这一变化旨在缓解双方因算力供应问题引发的摩擦。OpenAI现在可以从其他供应商获取算力,同时微软保留优先购买权。尽管算力排他性有变,但双方的合作基础保持不变,微软依然保留OpenAI技术在产品中的独家使用权。
🚀 MiniMax推出全新T2A-01系列语音模型
摘要:MiniMax于1月20日发布升级的T2A-01系列语音模型,全球同步上线海螺语音产品。用户可通过输入文字生成自然流畅的人声,最长支持10000字符。该产品支持17种语言,具备情感理解能力,自能识别和重现语音中的情感差别,提供300多种音色选择,适用于有声书、耳语、新闻播报等多场景。
🚀 美图WHEE推出AI海报功能 支持中文字体
摘要:美图WHEE近日宣布将推出「AI海报」功能,用户只需一句话即可生成多种海报,且支持中文字体。该功能涵盖电影、电商、自媒体及线下活动四大场景,提供多样化的定制模板和灵活排版。WHEE于2023年6月发布,是一款面向普通用户及专业创作者的在线AI视觉创作工具,提供文生图、图生图等多种AIGC图像服务。
🚀 阶跃星辰发布Step-2系列新语言模型
摘要:阶跃星辰于1月21日推出Step-2系列新语言模型,包括小巧高效的Step-2 mini和针对内容创作的Step-2文学大师版。Step-2 mini在保留80%性能的同时,参数量仅为万亿参数大模型的3%,具备更快生成速度和性价比。其独特的MFA架构显著节省了KV缓存开销。Step-2文学大师版则专注于提升内容创作能力,旨在解决现有模型内容缺乏创意和真实情感的问题。
🚀 OpenAI即将推出“Operator” AI功能
摘要:科技媒体报道,OpenAI将在macOS版ChatGPT应用中推出名为“Operator”的新AI功能,该功能将充当自主智能体,自动执行包括编码、网页浏览和旅行预订等任务。用户可通过应用中的快捷方式切换这一功能,Operator将利用macOS的辅助功能API与屏幕内容互动,并分析开发者工具中的代码。此功能旨在无需用户输入即可完成任务,且可能正在与其他AI工具进行基准测试。
更多AI工具 Github-AiBard123
广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:1752338621