AI新工具
banner

Gemma-7B


介绍:

谷歌推出的Gemma 70亿参数的语言模型









Gemma-7B

Gemma-7b是谷歌公司发布的一款轻量级、最先进的开放模型系列,是基于Gemini模型的研究和技术构建的。它是一种文本生成模型,采用了解码器结构,可用于多种文本生成任务,包括问答、摘要和推理。Gemma模型相对较小,适合在资源有限的环境中部署,如笔记本电脑、台式机或自己的云基础设施。模型采用了Responsible Generative AI Toolkit进行训练,使用了6万亿个令牌的文本数据集。该模型还提供了一些代码片段,以便用户快速上手运行模型。它还包括了一些优化方式,如使用不同精度的GPU运行、量化版本等。模型数据集包括网络文档、代码和数学文本,经过了CSAM过滤和敏感数据过滤等预处理。Gemma-7b是通过最新一代的Tensor Processing Unit (TPU)硬件(TPUv5e)进行训练的,使用了JAX和ML Pathways软件进行训练。模型的伦理和安全评估结果显示,其在安全性和道德方面的表现符合内部政策。模型的用途包括内容创作、研究和教育,但也有一些限制,如训练数据的质量和多样性、上下文和任务复杂性、语言的歧义性和微妙之处、事实准确性和常识推理、以及伦理考虑和风险。

可关注我们的公众号:每天AI新工具

广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:1752338621