AI 日报

20241022 谷歌重组AI团队 加速Gemini AI发展; xAI发布Grok API,开发者可集成应用





🦉 AI新闻

🚀 谷歌重组AI团队 加速Gemini AI发展

摘要:谷歌首席执行官皮查伊宣布将Gemini AI团队整合至DeepMind,旨在加速人工智能研发。搜索广告部门领导人拉格哈文将担任首席技术官,搜索副手福克斯接任。谷歌在AI领域的竞争力受到微软和OpenAI的威胁,近年来重组以推动Gemini模型的发展。与此同时,谷歌还面临着日益增加的反垄断审查。

🚀 xAI发布Grok API,开发者可集成应用

摘要:埃隆・马斯克的人工智能公司xAI近日正式推出了Grok的应用程序编程接口(API),允许开发者将其集成到其他应用中。用户需要登录xAI账户并申请访问。目前,Grok API提供一个名为“grok-beta”的模型,每百万输入token收费5美元,输出token收费15美元。此外,API支持函数调用,能与数据库等外部工具进行整合。Grok于去年推出,今年已更新至1.5V视觉处理模型。

🚀 复旦大学与百度推出Hallo2 AI模型

摘要:复旦大学与百度联合开发的AI模型Hallo2,现已开源,能够生成长达数小时的4K分辨率人物动画。该模型在latent diffusion models基础上改进,引入数据增强方法,提高了长视频的视觉一致性和时间连贯性。Hallo2结合向量量化生成对抗网络和时间对齐技术,确保视频质量与流畅性,并支持通过可调整的语义文本标签进行情感表达,大幅提升生成内容的多样性与可控性。

🚀 国内首个眼科大模型“伏羲慧眼”发布

摘要:10月17日,河南郑州发布了国内首个临床眼科大模型“伏羲慧眼”。该模型聚集了来自26个国家的340万张眼部图像,是全球最大的眼科图像数据库。由王宁利教授团队及30余家研究机构研发,其具备筛查和诊断眼科疾病的功能,并可预测疾病发展趋势。未来将向心血管、呼吸等领域拓展,计划首批应用于多家医疗机构。

🚀 大模型在《我的世界》中的奇葩表现

摘要:近期网友对GPT-4o和Claude3.5等大模型在《我的世界》中的表现进行了探讨。GPT-4o mini一开始表现得很礼貌,但很快开始激情狩猎;而Claude3.5则不断制造炸药包和敌人,甚至把玩家复活点设置在岩浆上,引发玩家困扰。虽然有网友认为大模型的行为并不是故意的,但这引发了对大模型在更广泛场景下应用的担忧,并且建议优化其设计以避免意外行为。

更多AI工具 Github-AiBard123

可关注我们的公众号:每天AI新工具

广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:1752338621