AI新工具(20240802) Google发布Gemma 2 2B轻量级AI模型,Gemini 1.5 Pro Exper 0801 登顶 lmsys.org 竞技场。karpathy大神发布nano-llama31
✨ 1: Gemma 2 2B
Gemma 2 2B是一个优先考虑安全性和透明性的高性能、轻量级AI模型。
Gemma 2 2B
Gemma 2 2B是Google推出的基于负责任AI开发的新一代开源模型的一部分。以下是关键要点:
-
性能与效率:Gemma 2 2B通过知识蒸馏从较大的模型中学习,在性能上超越了许多同类开源模型,并在LMSYS Chatbot Arena排行榜上表现优异。它可以在各种硬件上高效运行,从边缘设备到云端环境。
-
安全与透明:Gemma系列不仅强调性能,还优先考虑安全性和可访问性。新加入的ShieldGemma是专门设计的安全内容分类器,用于检测并减少AI模型中的有害内容,如仇恨言论和性暗示性内容。
-
模型解释性工具:Gemma Scope是一种新工具,利用稀疏自编码器(SAEs)提供对模型内部工作机制的深入理解,帮助研究人员更好地分析和理解模型的决策过程。
-
开放与合作:Gemma 2 2B及其相关工具都是开源的,鼓励社区的透明性和合作。这些工具旨在推动AI安全评估的发展,并为开发更安全、可靠的AI系统提供支持。
Gemini 1.5 Pro Exper 0801 登顶 lmsys.org 竞技场。
地址:https://developers.googleblog.com/en/smaller-safer-more-transparent-advancing-responsible-ai-with-gemma/
✨ 2: nano-llama31
nano-llama31是一个简化Llama 3.1运行环境,通过PyTorch和tiktoken实现并准备添加微调。
Nano-Llama31是一个简单的Llama 3.1版本实现,旨在通过最小化依赖来进行推理(推理规模目前为8B的基础模型,在单个40GB以上的GPU上运行)。目前代码大约有900行,使用的是PyTorch和tiktoken。开发者计划进一步缩小代码规模并添加微调功能。
地址:https://github.com/karpathy/nano-llama31
✨ 3: flux
FLUX 是 Black Forest Labs 的文本到图像及图像到图像转换模型。
Flux 是由 Black Forest Labs 开发的一个基于 Transformer 的潜变量修正流(latent rectified flow)模型,主要应用于文本生成图片(text-to-image)和图片生成图片(image-to-image)任务。该项目包含了最小推理代码,方便用户进行相关任务的实践。
Flux 项目提供了多种方式方便用户进行文本生成图片和图片生成图片的实验和应用,并且通过 API 和本地安装都可以方便地进行模型的调用和测试。
地址:https://github.com/black-forest-labs/flux
✨ 4: SF3D
SF3D 是一款快速稳定的3D网格重建工具,支持UV展平和光照分离。
SF3D(Stable Fast 3D Mesh Reconstruction with UV-unwrapping and Illumination Disentanglement)是一个先进的开源模型,可以从单张图像快速重建3D网格。该模型基于TripoSR,但引入了一些新的技术,使其能生成高质量且无瑕疵的3D网格和带有UV展开的纹理。此外,SF3D可以分离光照信息并预测材料参数,从而使生成的3D模型更容易集成到游戏中。尽管有这些改进,SF3D仍保持了TripoSR的快速推理速度。
游戏开发: 快速生成游戏中的3D资产,并且可以轻松调整光照和材料属性。 虚拟现实(VR)和增强现实(AR): 在VR/AR应用中快速制作逼真的3D模型。 电商: 为商品生成高清3D模型,提高用户的购物体验。 影视动画: 快速创建动画中的3D角色或道具。 工业设计: 快速创建产品的3D模型,进行设计验证和展示。
地址:https://github.com/Stability-AI/stable-fast-3d
✨ 5: RAG Me Up
RAG Me Up 是一款轻量级框架,方便用户在自己数据集上运行RAG。
RAG Me Up 是一个通用框架(包括服务器和UI),旨在让用户能够轻松地在自有数据集上进行RAG(Retrieval-Augmented Generation)。其核心是一个小巧轻便的服务器以及几种与服务器通信的UI运行方式(或者用户可以自行编写)。
RAG Me Up 可以在CPU上运行,但使用默认的指令模型时,建议在至少具有16GB显存的GPU上运行。
知识管理:帮助组织在内部知识库中快速找到相关信息。 客户服务:为客户查询提供即时且准确的回答。 研究与开发:支持大规模的文档检索和信息汇总。 法律和法规:协助法律专业人士在海量文档中查找相关法条和案例。
地址:https://github.com/AI-Commandos/RAGMeUp
更多AI工具,参考国内AiBard123,Github-AiBard123 公众号:每日AI新工具
广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:1752338621