Gemini spatial example
Gemini Spatial Example概述
Gemini Spatial Example展示了当前Gemini模型可以提供的边界框信息。该仓库展示了如何提示和显示边界框信息(其中包含一些技巧),其主要目的是为其他开发者提供演示示例和二次开发的基础。这个项目使用vite-express和一个最小化的服务器来访问API。
一个更简单的使用JSON提示的示例可以在这里找到。
本地运行方式
- 在Google AI开发者平台获取你的Gemini API Key。
- 将API Key放入
example.env
文件,并将文件名重命名为.env
。 - 使用以下命令安装依赖并运行:
npm install npm run dev
使用场景
- 计算机视觉应用:利用边界框信息进行对象检测和识别。
- 增强现实(AR)应用:在AR场景中对物体进行精确定位和交互。
- 自动驾驶:检测并识别环境中的障碍物及其他重要对象。
- 智能安防:监控视频中识别和跟踪可疑目标。
- 图像标注工具:帮助标注数据,为机器学习模型提供训练数据。
这个项目主要为开发者提供了一个基础,便于对Gemini模型提供的边界框信息进行探索和扩展开发,适用于各种需要空间信息识别和处理的应用。
广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:1752338621