AI新工具(20240204)
pot-desktop - 为用户提供便捷的文字翻译和识别功能
pot-desktop
pot-desktop是一款备受欢迎的跨平台划词翻译和OCR软件,为用户提供便捷的文字翻译和识别功能。
功能点:
-
划词翻译:用户只需将鼠标光标悬停在需要翻译的文字上,pot-desktop就会自动捕捉到选中的文字并显示翻译结果。这个功能对于需要频繁进行翻译的用户来说非常实用,可以省去打开翻译网站或应用的时间和步骤。
-
OCR功能:可以识别图片中的文字并将其转化为可编辑的文本。用户只需将图片拖拽到pot-desktop界面上,软件会自动识别图片中的文字并提供文本输出。
-
多语言支持:支持多种语言的翻译,用户可以根据自己的需求选择源语言和目标语言。同时提供了丰富的词典和在线翻译服务的支持。
-
技术实现:采用了先进的机器学习和自然语言处理算法,利用云服务来处理大规模的翻译请求,保证了高效的响应速度和准确的结果。
https://github.com/pot-app/pot-desktop
ChatALL - 能够同时向多个AI机器人发送提示,帮助用户发现最佳结果的客户端。
ChatALL
ChatALL是一个集成多个大型语言模型(LLMs)AI机器人的聊天工具,它具有以下功能点:
-
支持多个AI机器人:ChatALL支持多个AI机器人,包括ChatGPT、Bing Chat、Baidu ERNIE等,用户可以同时向这些机器人发送请求,以便比较它们的表现并找到最佳答案或创作。
-
快速提示模式:用户可以在不等待上一个请求完成的情况下发送下一个提示。
-
本地保存聊天记录:ChatALL会将所有的聊天记录、设置和登录数据保存在用户的计算机本地,以保护隐私。
-
高亮喜欢的回复、删除不喜欢的回复:用户可以突出显示自己喜欢的回复,删除不喜欢的回复。
-
支持自定义机器人:用户可以随时启用/禁用任何机器人,以及在一、两、三列视图之间切换。
-
自动更新到最新版本:ChatALL支持自动更新到最新版本,让用户始终使用最新的功能。
-
Dark mode:支持暗黑模式,保护视力。
-
多语言支持:ChatALL支持多种语言,包括中文、英文、德文、法文、俄文、越南文、韩文、日文、西班牙文、意大利文。
-
支持多平台:ChatALL可以在Windows、macOS和Linux上运行。
-
隐私保护:所有聊天记录、设置和登录数据都保存在用户的计算机本地,同时收集匿名的使用数据以帮助改进产品。
-
部署到GitHub Pages:计划中的特性,欢迎开发者
https://github.com/sunner/ChatALL
chatbot-ollama - Ollama 的开源聊天 UI。
chatbot-ollama
Chatbot Ollama 是 Ollama 的开源聊天 UI,基于Mckay Wrigley的chatbot-ui项目开发。它将会随着时间的推移而更新,并提供拉取模型、删除模型、显示模型信息等功能。您可以通过在本地构建或从 ghcr 中提取 Docker 镜像来运行 Chatbot Ollama。在部署该应用程序时,可以设置默认模型、默认系统提示和默认温度等环境变量。
https://github.com/ivanfioravanti/chatbot-ollama
Self-Operating Computer Framework - 一个用多模型能够操作计算机的框架。
Self-Operating Computer Framework
Self-Operating Computer Framework是一个可以让多模态模型操作计算机的框架。它使用与人类操作者相同的输入和输出,观察屏幕并决定一系列鼠标和键盘操作以达成目标。
功能点包括:
- 兼容性:为各种多模态模型设计。
- 集成:目前默认与GPT-4v集成,同时对Gemini Pro Vision提供扩展支持。
- 未来计划:支持额外的模型。
- Agent-1-Vision模型的API访问。
- 使用Gemini模型进行操作。
- 光学字符识别模式(OCR)。
- Set-of-Mark(SoM)提示支持。
- 声音模式。
- 兼容性:支持Mac OS、Windows和已安装X服务器的Linux。
https://github.com/OthersideAI/self-operating-computer
kimi chat - 一个有着超大 内存 的智能助手,可以一口气读完二十万字的小说,还会上网冲浪,快来跟他聊聊吧
kimi chat
kimi chat是一款免费的AI对话聊天工具,具有多种功能点,包括:
-
支持长文输入:最大支持20万字的输入,能够用于分析文档、网络搜索并整合资料、内容创作、教育辅导、编程辅助等。
-
外语翻译:可以翻译英文、韩文、日文,但不能翻译俄语。
-
写代码辅助办公:能够生成Python代码,用于统计长文档中的中文字数,以及拆分文档。
-
文字识别:能够识别图片中的文字,并整理格式。
-
会议纪要、文章生成:能够将录音转换为文本,并用于总结会议内容或生成文章。
-
制作思维导图:可以生成思维导图,用Markdown格式输出,并转换为思维导图工具。
kimi chat在长文输入、外语翻译、写代码辅助、文字识别、会议纪要生成和思维导图制作方面都有较为出色的表现,是一款值得尝试的AI工具。但需要注意的是,使用任何AI生成的内容时都需要谨慎甄别,因为目前AI生成的内容无法做到百分之百准确。
更多AI工具,参考国内AiBard123,Github-AiBard123
广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:1752338621