20240913 OpenAI发布全新o1 AI模型具备推理能力
🦉 AI新闻
🚀 OpenAI发布全新o1 AI模型具备推理能力
摘要:OpenAI推出新AI模型o1,具备推理能力,旨在比人类更快地解决复杂问题。o1与o1-mini版本同时发布,前者训练成本较高,但在编程和多步骤问题上表现优异。与GPT-4o相比,o1在数学和编程竞赛中表现更佳,正确率显著提高。尽管o1在知识面和功能上尚不及GPT-4o,但代表了AI发展的新方向。当前o1处于预览阶段,计划推广至更多用户。
🚀 谷歌Gemini Live面向所有安卓用户开放
摘要:谷歌近日宣布,Gemini Live服务已逐步向所有安卓用户免费开放,提供更加流畅的对话体验。该功能最初在1个月前向Advanced订阅用户发布,允许用户与Gemini进行多轮对话,具有更强的情感表达能力。使用英语的安卓用户现在可以随时与助手互动,而iOS用户尚未能体验该功能。Gemini Live对标OpenAI最新的语音聊天模式,提升了人工智能交互的便捷性。
🚀 谢尔盖·布林谈谷歌AI进展
摘要:谷歌联合创始人谢尔盖·布林在“All-In”峰会上表示,谷歌工程师并未充分利用人工智能工具。他赞赏AI在编程方面的能力,并分享了让AI编写数独代码的实验结果。布林认为谷歌在早期发布语言模型时过于谨慎,因为其错误和尴尬言论限制了AI的发展。他呼吁工程师们勇于尝试,以推动AI编程的进步。
🚀 AI唇语识别软件Readtheirlips引发热议
摘要:一款名为Readtheirlips的AI唇语识别软件在国外走红。该软件能够通过分析视频中说话者的唇部动作,准确转录其言语。测试结果显示,正面镜头的识别效果很好,但偏离正面或语速过快时准确率下降。开发团队表示正在改进技术并计划延长视频时长限制。Readtheirlips由初创公司Symphonic Labs研发,现已开放试玩,吸引了众多网友讨论与尝试。
🚀 Gemini应用新增Gems功能,支持管理自定义指令
摘要:Gemini应用已在iOS和安卓版中新增对Gem和Gem管理器的支持,用户可在主屏幕上查看聊天记录并管理自定义Gems。Gems可以帮助用户创建和保存针对特定需求的指令,提高AI助理的响应效率。用户在创建新Gems时会被引导至网页版,Gemini还需更进一步支持Google助理的部分语音功能,目前尚可通过设置切换回Google助理。
更多AI工具 Github-AiBard123
广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:1752338621