AI新工具
banner

Gemini Cursor


介绍:

Gemini Cursor 是一款智能桌面鼠标,能够识别屏幕、听取语音并进行对话。









Gemini Cursor

Gemini Cursor 简介

Gemini Cursor 是一款桌面应用程序,它为用户提供了一个第二个 AI 光标,能够实时理解界面内容,包括视觉和听觉信息。基于谷歌的 Gemini 2.0 Flash(实验性)模型,支持多模态交互,能够识别屏幕内容、听取用户的语音,并进行对话。

主要特点
  • 🖱️ 提供第二个 AI 光标,用于增强桌面操作体验
  • 🚀 支持多模态功能:可以“看”屏幕内容、听取语音并进行“对话”
  • ⚡️ 具有实时性,延迟低,确保流畅的用户体验
使用场景
  • 📚 理解研究论文中的复杂图表,例如架构图等
  • 🌐 导航复杂的网站以完成特定任务,比如在亚马逊上添加支付方式
  • 📝 作为实时 AI 辅导员支持白板教学,帮助用户学习新知识和技能
技术栈
  • 前端:Electron、React、TypeScript、Vite
  • AI:谷歌的 Gemini API
安装与使用

用户需要安装 Node.js 和 npm,并获取 Gemini API 密钥。之后,通过简单的命令行操作克隆、安装和运行应用程序,输入 API 密钥后即可使用 Gemini Cursor。

通过以上特点和使用场景,可以看出 Gemini Cursor 不仅可以提升用户的工作效率,还能够增强学习和理解的能力。

可关注我们的公众号:每天AI新工具

广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:1752338621