AI 日报

20241106 腾讯开源首个文图生3D大模型Hunyuan3D-1.0





🦉 AI新闻

🚀 腾讯开源首个文图生3D大模型Hunyuan3D-1.0

摘要:腾讯混元于11月5日开源了Hunyuan3D-1.0,这是首个同时支持文本生成和图像生成的3D开源大模型。该模型采用两阶段生成方法,可以在10秒内生成3D资产。第一阶段使用多视角扩散模型生成多视角图像,第二阶段利用前馈重建模型快速重建3D资产,具有强大的泛化能力和可控性,适用于多种尺度的物体。

🚀 Anthropic发布Claude 3.5 Haiku模型

摘要:Anthropic于11月4日发布Claude 3.5 Haiku模型,通过第一方API、Amazon Bedrock和Google Cloud的Vertex AI可供开发者使用。此模型在多项AI基准测试中超越了前代模型Claude 3 Opus,当前仅支持文本输入,未来将添加图像输入。API定价为:输入每百万tokens 1美元,输出每百万tokens 5美元。相比之下,OpenAI和谷歌的类似模型定价明显更低,这引发了开发者的关注。

🚀 LLaMA版o1项目发布,开源强化学习代码

摘要:上海AI Lab团队发布了LLaMA版o1项目,该项目使用蒙特卡洛树搜索和自我对弈强化学习技术,旨在提升大模型的数学能力。开源代码包括预训练数据集和强化学习训练代码,通过成对优化显著提高了模型在AIME2024基准测试中的表现。此外,O1-Journey项目也在进展中,展示了新的学习范式。该项目的开源和研究成果引发了开发者社区的广泛关注。

🚀 OpenAI首席执行官谈招聘策略

摘要:OpenAI首席执行官萨姆·阿尔特曼在节目中表示,公司招聘时优先考虑才能,而非年龄。他强调,年轻、缺乏经验的人和拥有丰富经验的中年人才都应被考虑。尽管面临高管人才争夺,但初级岗位竞争激烈,许多求职者难以找到职位。一些年长员工面临年龄歧视,而年轻员工则感受到负面刻板印象,职场环境日益复杂。

🚀 昆仑万维天工 AI 发布高级搜索功能升级

摘要:昆仑万维天工 AI 于11月5日发布了最新的AI高级搜索功能,涵盖金融投资、科研学术和文档阅读分析等领域的全面升级。新版本增强了多层次分析推理能力,能拆解复杂问题并自动生成任务规划,同时支持超长文本处理和多模态输出。金融研究上,天工 AI 可快速提取财报核心数据,科研功能则通过丰富的学术数据库分析论文。该功能现处于免费使用阶段。

🚀 iOS 18.2更新将引入多项AI功能

摘要:苹果公司将在即将发布的iOS 18.2更新中,为备忘录应用带来三项重要的AI改进。其中包括图像魔杖功能,可以将用户的草图转化为高质量插图,支持文生图生成原创图像。此外,更新还将增强文本撰写与重写功能,用户可通过AI生成文本或调整已有文本,这使备忘录应用不仅能记录,还能成为智能写作助手,提升创作效率。

🚀 Google推出手写识别AI系统InkSight

摘要:Google Research开发的InkSight系统能够高效从手写文字的图片中提取数字文本,摆脱传统OCR的限制。通过模仿人类的阅读过程,InkSight在复杂环境下表现出色,识别准确率高达87%。这一技术不仅便利了手写内容的数字化,还对传统手写文本的保存与转化具有重要意义,能帮助保留低数字化语言的手写遗产。其他公司如亚马逊和Goodnotes也在发展类似工具。

更多AI工具 Github-AiBard123

可关注我们的公众号:每天AI新工具

广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:1752338621