AI 新工具

AI新工具(20240628) Google深夜发布更高性能的大模型Gemma 2;需要图片放大修复的看看这个开源放大器;原型设计Figma推出了一系列AI功能





✨ 1: Gemma 2

Google发布Gemma 2,面向研究人员和开发者的下一代开源模型。

Gemma 2

谷歌 推出了最新推出的开放模型 Gemma 2,这是一个轻量级、最先进的开放式模型系列,用创建 Gemini 模型的相同研究和技术构建,现已向全球的研究人员和开发者开放。与第一代相比,Gemma 2 在性能和推理效率上有了显著提升,支持9B和27B参数规模的小模型。其主要特点包括:

卓越性能:27B参数的Gemma 2在其规模类别中表现最佳,甚至可以与更大规模的模型竞争,9B Gemma 2 模型也提供一流的性能,优于 Llama 3 8B 和其他尺寸类别的开放式模型。 高效成本:27B Gemma 2 模型旨在在单个 Google Cloud TPU 主机、NVIDIA A100 80GB Tensor Core GPU 或 NVIDIA H100 Tensor Core GPU 上以全精度高效运行推理,从而在保持高性能的同时显著降低成本。这允许更易于访问且预算友好的 AI 部署。 快速推理:Gemma 2 经过优化,可在一系列硬件上以令人难以置信的速度运行,从功能强大的游戏笔记本电脑和高端台式机到基于云的设置。在 Google AI Studio 中全精度试用 Gemma 2,在 CPU 上使用 Gemma.cpp 的量化版本解锁本地性能,或者通过 Hugging Face Transformer 在配备 NVIDIA RTX 或 GeForce RTX 的家用计算机上试用。

Gemma 2 还改进了安全性和兼容性, 被设计成易于与现有的AI工具和框架(如Hugging Face、JAX、PyTorch、TensorFlow 等)集成。开发者可以通过Google AI Studio 和Kaggle 免费试用或下载Gemma 2的模型权重。

这款新模型的一些安全发展包括数据过滤、严格的测试和评估,以避免潜在的偏见和风险。

地址:https://blog.google/technology/developers/google-gemma-2/

✨ 2: aurasr

AuraSR 是一个开源的GigaGAN放大器,能将低分辨率图像无损放大4倍。

AuraSR是一个开源重现GigaGAN图像提升的模型,拥有600M参数。它可以将低分辨率图像提升至原图像的4倍,并且可以多次应用。该模型特别适用于通过文本生成图像的模型上,并且在分辨率和提升倍数上没有限制。相比于基于迭代过程的扩散模型,AuraSR使用生成对抗网络(GAN)技术,通过一次前向传播就能完成图像生成和提升,速度要快很多。例如,它能够在0.25秒内生成1024像素的图像(提升4倍)。

该模型在完全开源的许可下发布,致力于广大开发者和研究人员的使用。

github:https://github.com/fal-ai/aura-sr

地址:https://blog.fal.ai/introducing-aurasr-an-open-reproduction-of-the-gigagan-upscaler-2/

✨ 3: figma

Figma 是一个集设计、原型制作与跨团队协作的强大工具。

Figma 是一款集设计与原型于一体的工具,主要帮助设计师和团队协作高效完成设计工作。它包括以下几个主要模块:

Figma Design:这是Figma的核心模块,支持用户在一个地方进行设计和原型制作。 FigJam:一个数字白板工具,方便团队协作和头脑风暴。 Dev Mode:帮助设计和开发对接,轻松将设计转换为代码。 Figma Slides(Beta版):用于创作演示文稿的工具,支持协同创作,预计2025年正式发布。

Figma最近在2024年的Config大会上推出了多个新功能和产品:

AI功能:通过AI提高设计效率,包括自动生成设计草稿、重命名图层、即时生成原型等。 重新设计的UI:UI3编辑器更加易用和灵活。 新的Dev Mode视图和功能:包括新的状态标签、细化设计视图、以及从支持的UI组件库直接添加代码。 Figma Slides:一个新的演示工具,具有高级设计功能和协同创作工具。

此外,Figma还完善了其他基础功能,例如响应式的自动布局、更灵活的原型查看器、以及提供默认UI组件库以加速设计过程。

地址:https://www.figma.com/whats-new/

✨ 4: gpt-frontend-code-gen

gpt-frontend-code-gen 是一款通过对话生成和迭代前端页面的工具。

gpt-frontend-code-gen 是一个基于 React 和 Vite 构建的前端项目,配合 Koa 框架的后端服务,用于生成和预览前端页面和组件。通过与系统对话,用户可以不断调整页面效果,实现高效的前端开发。

生成 React 组件:基于 GPT-4,可以生成不同的 React 组件。 组件库支持:支持生成 Chakra UI 组件和 ShadcnUI 组件。 实时预览:生成的组件可以实时预览。 持续对话修改:通过与系统持续对话,可以即时修改和更新生成的组件。 多模型支持:配置自己的 APIKey 和 BaseUrl,支持多种大模型。 一键启动:使用 Docker 和 Docker Compose 实现一键设置和启动。

地址:https://github.com/bravekingzhang/gpt-frontend-code-gen

✨ 5: Rodel Agent

Rodel Agent 是一款集成多种AI服务的Windows桌面应用。

Rodel Agent是一款Windows桌面应用程序,集成了聊天、文本转图像、文本转语音和机器翻译等功能,支持当前主流的AI服务,致力于为用户提供卓越的桌面AI体验。

聊天功能:用户可以通过Rodel Agent与AI进行互动对话,获取信息或进行日常交流。 文本转图像:用户可以输入文字描述,通过AI生成相应的图像,适用于创意设计和快速图像生成。 文本转语音:将文字内容转换为语音播放,适用于有听力需求的用户或语音广播任务。 机器翻译:进行多语言的即时翻译,提升跨语言交流的效率。

地址:https://github.com/Richasy/Rodel.Agent



更多AI工具,参考国内AiBard123Github-AiBard123 公众号:每日AI新工具

可关注我们的公众号:每天AI新工具

广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:1752338621