AI 新工具

AI新工具(20240717) iOS上运行本地开源模型H2O;支持工程师更高效地进行软件开发;开源的企业文档分析工具OpenContracts





✨ 1: H2O AI Personal GPT

H2O AI Personal GPT是一款无需联网、完全保护隐私的智能AI助手应用。

H2O AI Personal GPT

H2O AI Personal GPT是由H2O.ai公司推出的一款AI助手应用,专为iPhone、iPad和Mac等苹果设备设计。该应用最大的特点是注重隐私,所有的数据处理均在用户设备上本地进行,不需要互联网连接,这确保了用户的问题、数据和响应不会离开设备。

隐私优先:完全本地处理用户数据,保证隐私安全。 智能高效:基于先进的AI技术,提供快速而智能的任务响应。 离线功能:无需互联网连接,随时随地使用,非常适合外出时使用。 可定制化:用户可以根据个人需求对AI助手进行设置,提供个性化体验。 用户友好界面:设计直观,易于使用,无论用户是否擅长技术都能轻松上手。

模型地址:https://huggingface.co/collections/h2oai/h2o-danube3-6687a993641452457854c609

地址:https://apps.apple.com/us/app/h2o-ai-personal-gpt/id6504365990

✨ 2: UltraPixel

UltraPixel是一种推进超高分辨率图像合成的新技术。

UltraPixel是一种用于超高分辨率图像生成的先进技术。其核心是利用预训练模型和特定算法生成高质量且富有细节的图像。主要采用StableCascade模型,通过分阶段解码的方式实现有效内存管理。UltraPixel提供了文本引导的图像生成、个性化图像生成和ControlNet图像生成等功能。

文本引导图像生成:用户通过详细描述来生成图像,建议使用具体而清晰的描述,并添加高质量修饰词,如"高质量"、“丰富细节”、“8k"等,以生成美观的图像。 个性化图像生成:例如个性化的猫照片,在文本中使用特定标识符生成定制化的结果。 ControlNet图像生成:结合Canny ControlNet生成更多样化的图像,支持最高4K分辨率。

地址:https://github.com/catcathh/UltraPixel

✨ 3: UMI on Legs

UMI on Legs把基于操纵的全身控制策略应用于拥有机械臂的四足机器人。

UMI on Legs 是一种将真实世界的人类操作示范与在模拟环境中训练的全身控制器结合起来的框架,主要应用于为配备机械臂的四足机器人提供可扩展的操作技能。

移动操作政策:将现有的视觉运动政策无缝集成到四足机器人上,使这些操作政策具有移动性。 全身控制器训练:提供用于训练全身控制器的源码,可在模拟环境中进行全面的测试和优化。 真实世界部署:包括在真实环境中部署全身控制器、使用iPhone进行里程计测量等多种实用工具。 数据采集与预处理:通过提供视觉和运动数据采集工具和预处理方法,增强机器人在复杂环境中的操作能力。 扩展和适应性:可以拓展到更多机器人的操作以及更丰富的操作轨迹,增强系统的通用性和适应能力。

地址:https://github.com/real-stanford/umi-on-legs

✨ 4: Claude Engineer

支持工程师更高效地进行软件开发

claude-engineer 包含各类资源以帮助开发者自动化工作流、管理代码包、修复漏洞和协作开发等。

以下是 claude-engineer 项目的主要特点:

自动化工作流:使用 GitHub Actions 工具,开发者可以轻松地自动化各种开发工作流,从而节省时间和精力。 代码包管理:项目提供了托管和管理代码包的功能,方便团队之间的共享和使用。 安全性:通过提供检查和修复代码漏洞的功能,claude-engineer 帮助开发者提升代码的安全性。 即时开发环境:开发者可以利用 Codespaces 功能创建即时的开发环境,不需要繁琐的配置步骤。 AI 辅助编程:GitHub Copilot 集成,使得开发者可以借助 AI 的力量编写更高质量的代码。 代码审查和协作:项目提供了高效的代码审查工具,以及方便的协作功能,可在代码之外通过 Discussions 平台进行讨论。

地址:https://github.com/Doriandarko/claude-engineer

✨ 5: OpenContracts

OpenContracts是一个开源的企业文档分析工具,支持自动化与手动注释功能。

OpenContracts

OpenContracts 是一个基于 Apache-2 许可的企业文档分析工具。它提供了多种关键功能,可以帮助用户管理文档、自动提取 PDF 布局特征、生成矢量嵌入以及提供人工注释界面等。其主要特点包括:

文档管理:管理文档集。 布局解析器:自动从 PDF 文件中提取布局特征。 自动矢量嵌入:为上传的 PDF 和提取的布局块生成矢量嵌入。 可插拔的微服务分析架构:让用户可以分析和自动注释文档。 人工注释界面:人工注释文档,支持多页注释。 LlamaIndex 集成:利用其矢量存储以及手动或自动注释的特征,让 LLM 智能回答问题。 数据提取:使用复杂的 LLM 驱动的查询行为,在数百份文档中提问。 自定义数据提取:可以在前端使用自定义数据提取管道批量查询文档。

地址:https://github.com/JSv4/OpenContracts



更多AI工具,参考国内AiBard123Github-AiBard123 公众号:每日AI新工具

可关注我们的公众号:每天AI新工具

广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:1752338621