AI新工具(20240514) GPT-4o让世界再次明亮起来;不超过25美元让普通眼镜变智能;PDF自动化翻译工具
✨ 1: GPT-4o
GPT-4o是OpenAI发布的新一代免费模型,支持文本、语音和图像的实时交互。
GPT-4o 是 OpenAI 最新推出的多模态旗舰生成模型,能够接收和生成文本、音频和图像。这意味着你可以用语音、文字和图片与它交互,并获得相应的回复。GPT-4o 在文本处理、视觉识别和音频理解上都比之前的版本要强大很多。它的反应速度极快,甚至能够模拟情感,做到更加自然和人性化的交互。
- OpenAI 未来的产品将以免费为优先,以让更多人使用为目标。
- OpenAI 发布了桌面版本的程序和更新后的 UI,更加简单自然。
- 推出了新一代大模型 GPT-4o,具有文本、语音、图像三种模态的理解力,反应极快,具有极为自然的交互方式。
地址:https://openai.com/index/hello-gpt-4o/
✨ 2: OpenGlass
使任何普通眼镜通过不超过25美元的现成组件变成可编程的智能眼镜
OpenGlass是一个开源项目,它旨在使任何普通眼镜通过不超过25美元的现成组件变成可编程的智能眼镜。这个项目的目标是提供一个既实惠又功能丰富的智能眼镜解决方案,用户可以通过这些智能眼镜记录生活、记住遇见的人、识别物体、翻译文字等等。
OpenGlass项目通过提供一个经济实惠且功能丰富的解决方案,扩大了智能眼镜的应用范围,使其不仅限于技术爱好者或有特殊需求的用户,而是更广泛的人群都能享受到智能眼镜带来的便利和乐趣。
地址:https://github.com/BasedHardware/openglass
✨ 3: lluminous
一个完全免费、快速的聊天机器人前端,支持多种模型和并行工具调用。
lluminous 是一个完全免费的、开源的、高速的聊天机器人前端应用。 可以使用在线托管的实例:https://lluminous.chat,不过要使用工具调用,仍然需要在本地运行lluminous服务。
地址:https://github.com/zakkor/lluminous
✨ 4: OS-Copilot
一个开源库,用于构建能自我改进的多功能计算机代理
OS-Copilot是一个开源的软体库,它能建立可以自动操作操作系统各种元素的通用型代理,比如网页、代码终端、文件、多媒体以及各种第三方应用。OS-Copilot旨在让这些代理具有自我改进能力。例如,基于OS-Copilot构建的FRIDAY,是一个能够自行提高解决计算机任务的AI助手。
地址:https://github.com/OS-Copilot/OS-Copilot
✨ 5: Indqx PDF
Indqx PDF 翻译提供论文PDF的自动化翻译,确保格式不变并可在本地运行。
Indqx PDF 翻訳是一种特别为学术论文设计的 PDF 翻译工具,其主要功能是能够在不破坏 PDF 格式的情况下,对文档进行翻译。下面是这个工具的主要特点和使用情境的详细总结:
-
自动识别正文:
- 这个功能会自动识别并翻译文档中的主要内容,比如正文部分,而忽略数式、标题等不需要翻译的部分。
-
合并翻译块:
- 如果在检测到的文本块中没有结束符号(如句号、冒号等),工具会将多个文本块合并成一个进行翻译。这样可以避免翻译文本在块与块之间或页与页之间断开的情况。
-
图表说明的分割翻译:
- 工具会自动识别图表的说明文本,并将其与正文分开进行翻译。
地址:https://github.com/Mega-Gorilla/Index_PDF_Translation
更多AI工具,参考国内AiBard123,Github-AiBard123
广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:1752338621