20241120 微软在Ignite 2024发布Copilot+新功能
🦉 AI新闻
🚀 微软在Ignite 2024发布Copilot+新功能
摘要:微软在Ignite 2024大会上宣布,Microsoft 365 Copilot将利用Copilot+ PC中的NPU本地运行AI模型,减少网络依赖。此功能将提升用户在Outlook和Word中的AI写作辅助体验。同时,Windows Recall功能因安全问题推迟,微软承诺改进其安全性。新发布的Windows Copilot Runtime为开发者提供了图像处理API,计划在2025年推出,预计将吸引更多应用程序使用这一技术。
🚀 首个自发性视觉语言模型LLaVA-o1发布
摘要:由北京大学、清华大学等机构联合研发的LLaVA-o1是一款首个具备自发性和系统性推理能力的视觉语言模型,拥有110亿个参数,基于Llama-3.2-Vision-Instruct模型。该模型设计有总结、描述、推理和结论四个推理阶段,能通过阶段级束搜索技术生成多个候选答案。LLaVA-o1在复杂视觉问答任务中表现优异,提升了多模态推理基准测试的性能,填补了文本与视觉问答模型间的空白。
🚀 Mistral AI发布多模态AI模型Pixtral Large
摘要:Mistral AI于11月18日推出全新多模态AI模型Pixtral Large,该模型具有1240亿参数,能够处理文本和图像。该模型在MathVista等多个基准测试中表现优异,尤其在MathVista中识别准确率达到69.4%,超越了竞争对手。Pixtral Large配备123B的多模态解码器和1B的视觉编码器,支持128K上下文窗口,能处理至少30张高分辨率图像,展现出强大的视觉数据处理及推理能力。
🚀 阿里推出Qwen2.5-Turbo AI模型
摘要:阿里通义千问近日发布了Qwen2.5-Turbo开源AI模型,显著提升了上下文长度到100万tokens,标志着在处理长文本时的重大进步。该模型在多项基准测试中超越了GPT-4,并通过稀疏注意力机制将处理时间缩短至68秒。同时,Qwen2.5-Turbo的处理成本也保持在每百万个tokens仅为0.3元,显示出更强的经济性。尽管表现优异,团队仍承诺将持续优化模型以应对实际应用中的挑战。
🚀 腾讯混元大模型负责人刘威离职
摘要:腾讯杰出科学家刘威已从公司离职,曾担任混元大模型技术负责人,长期从事计算机视觉和机器学习研究。他在多个国际会议中发表重要演讲,并获得诸多荣誉,包括2023 IEEE Fellow。刘威于2017年加盟腾讯AI Lab,推动了混元大模型的发展,最新发布的腾讯混元 Turbo在效率和成本上有显著提升。
更多AI工具 Github-AiBard123
广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:1752338621