AI 新工具

AI新工具(20240514) GPT-4o让世界再次明亮起来;不超过25美元让普通眼镜变智能;PDF自动化翻译工具





✨ 1: GPT-4o

GPT-4o是OpenAI发布的新一代免费模型,支持文本、语音和图像的实时交互。

GPT-4o 是 OpenAI 最新推出的多模态旗舰生成模型,能够接收和生成文本、音频和图像。这意味着你可以用语音、文字和图片与它交互,并获得相应的回复。GPT-4o 在文本处理、视觉识别和音频理解上都比之前的版本要强大很多。它的反应速度极快,甚至能够模拟情感,做到更加自然和人性化的交互。

  1. OpenAI 未来的产品将以免费为优先,以让更多人使用为目标。
  2. OpenAI 发布了桌面版本的程序和更新后的 UI,更加简单自然。
  3. 推出了新一代大模型 GPT-4o,具有文本、语音、图像三种模态的理解力,反应极快,具有极为自然的交互方式。

地址:https://openai.com/index/hello-gpt-4o/

✨ 2: OpenGlass

使任何普通眼镜通过不超过25美元的现成组件变成可编程的智能眼镜

OpenGlass是一个开源项目,它旨在使任何普通眼镜通过不超过25美元的现成组件变成可编程的智能眼镜。这个项目的目标是提供一个既实惠又功能丰富的智能眼镜解决方案,用户可以通过这些智能眼镜记录生活、记住遇见的人、识别物体、翻译文字等等。

OpenGlass项目通过提供一个经济实惠且功能丰富的解决方案,扩大了智能眼镜的应用范围,使其不仅限于技术爱好者或有特殊需求的用户,而是更广泛的人群都能享受到智能眼镜带来的便利和乐趣。

地址:https://github.com/BasedHardware/openglass

✨ 3: lluminous

一个完全免费、快速的聊天机器人前端,支持多种模型和并行工具调用。

lluminous 是一个完全免费的、开源的、高速的聊天机器人前端应用。 可以使用在线托管的实例:https://lluminous.chat,不过要使用工具调用,仍然需要在本地运行lluminous服务。

地址:https://github.com/zakkor/lluminous

✨ 4: OS-Copilot

一个开源库,用于构建能自我改进的多功能计算机代理

OS-Copilot是一个开源的软体库,它能建立可以自动操作操作系统各种元素的通用型代理,比如网页、代码终端、文件、多媒体以及各种第三方应用。OS-Copilot旨在让这些代理具有自我改进能力。例如,基于OS-Copilot构建的FRIDAY,是一个能够自行提高解决计算机任务的AI助手。

地址:https://github.com/OS-Copilot/OS-Copilot

✨ 5: Indqx PDF

Indqx PDF 翻译提供论文PDF的自动化翻译,确保格式不变并可在本地运行。

Indqx PDF 翻訳是一种特别为学术论文设计的 PDF 翻译工具,其主要功能是能够在不破坏 PDF 格式的情况下,对文档进行翻译。下面是这个工具的主要特点和使用情境的详细总结:

  1. 自动识别正文

    • 这个功能会自动识别并翻译文档中的主要内容,比如正文部分,而忽略数式、标题等不需要翻译的部分。
  2. 合并翻译块

    • 如果在检测到的文本块中没有结束符号(如句号、冒号等),工具会将多个文本块合并成一个进行翻译。这样可以避免翻译文本在块与块之间或页与页之间断开的情况。
  3. 图表说明的分割翻译

    • 工具会自动识别图表的说明文本,并将其与正文分开进行翻译。

地址:https://github.com/Mega-Gorilla/Index_PDF_Translation



更多AI工具,参考国内AiBard123Github-AiBard123

可关注我们的公众号:每天AI新工具

广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:1752338621