AI新工具(20240501) 通过自然语言处理执行特定任务的AI Agents;大模型控制NPC执行一系列的动作;个人化的电子邮件助手Panza
✨ 1: OpenAgents
通过自然语言处理执行特定任务的AI代理
OpenAgents是一个开放平台,旨在使语言代理(即通过自然语言处理执行特定任务的AI代理)的使用和托管变得更加便捷和实用。它特别适合于日常生活中对数据分析、工具插件获取和网络浏览有需求的用户,无论是专业人士还是普通用户。下面是对OpenAgents功能的通俗总结,以及使用OpenAgents的典型情形。
-
数据代理(Data Agent):提供一套全方位的数据操作工具,包括数据搜索、处理、修改和可视化。无论是编写Python/SQL代码进行数据分析,还是使用数据工具进行操作,数据代理都能简化这些任务。
-
插件代理(Plugins Agent):集成了200多个日常工具的插件,可以有效提升各种任务和活动的效率。从购物、查看天气、科学探索等方面,插件代理能够提供快速的解决方案。
-
网页代理(Web Agent):借助Chrome扩展,能够自动浏览和探索网页内容。无论是导航Google Maps、发布Twitter帖子,还是填写Google表单,网页代理都能提供支持。
地址:https://github.com/xlang-ai/OpenAgents
✨ 2: LangChain
.NET实现LangChain
LangChain是一个.NET框架,用于通过组合可编程方式建立使用大型语言模型(LLMs)的应用程序。这意味着你可以通过LangChain轻松集成和操作诸如OpenAI的GPT-3.5 Turbo等强大的AI模型,以进行文本生成、问题回答、文档分析等任务。LangChain的核心是可扩展性和灵活性,提供了一个架构,允许开发者以模块化的方式构建复杂的语言处理流水线。
地址:https://github.com/tryAGI/LangChain
✨ 3: surya
强大的文档光学字符识别(OCR)工具包
Surya是一款强大的文档光学字符识别(OCR)工具包, Surya的优势在于它可以在本地运行,无需依赖第三方云服务,保证了高级别的隐私保护和数据安全。此外,其支持的语言数量多,功能强大,不仅能识别文本,还能进行布局分析和阅读顺序检测,非常适合需要处理复杂文档的场景。
地址:https://github.com/VikParuchuri/surya
✨ 4: gigax
基于大型语言模型(LLM)的技术,Gigax使得NPC能够执行一系列的动作,比如说话、跳跃、攻击等
Gigax提供了一个强大而灵活的解决方案,以加强视频游戏中非玩家角色(NPCs)的互动和行为。通过使用基于大型语言模型(LLM)的技术,Gigax使得NPC能够执行一系列的动作,比如说话、跳跃、攻击等,这些动作都是根据游戏开发者的定义来执行的。这意味着,通过Gigax,NPCs可以更自然和真实地与玩家互动,从而提升游戏的沉浸感和体验。
主要功能:
- NPCs交互:可以定制NPCs的说话、跳跃、攻击等动作。
- 高效推断:在大多数机器上,GPU推断时间不到1秒。
- 开源预训练模型:提供了从Llama-3、Phi-3、Mistral等模型微调的开源模型。
- 结构化生成:通过Outlines确保输出格式始终得到遵守,使生成的内容更加有组织和一致。
- 即将推出的功能:包括本地服务器模式(带有语言无关API)、运行时任务生成、NPC记忆的创建、存储和检索。
当游戏开发者希望使他们的游戏世界更加生动、互动和个性化时,使用Gigax会是一个极佳的选择。无论是要创建有深度的角色对话,还是设计复杂的行为和任务,Gigax都提供了必要的工具和框架,让这一切成为可能。
地址:https://github.com/GigaxGames/gigax
✨ 5: Panza
个人化的电子邮件助手
Panza是一个个人化的电子邮件助手,旨在根据您的写作风格和过往邮件历史定制。它的工作原理基于一种称为“数据回放”的数据集生成技术,通过此技术,Panza利用预训练的大型语言模型(LLM)来总结您过去的电子邮件,并将每封邮件转换为“(合成指令, 实际电子邮件)”对。这些对被用来训练Panza,使其能够在只给出指令的情况下生成目标邮件,从而学习用户的写作风格。Panza还利用了名为Robust Adaptation(RoSA)的本地微调技术,结合低秩(LoRA)和稀疏微调来提高参数效率。此外,Panza通过检索增强生成(RAG)模块运行,该模块能够存储过去的电子邮件并在每次查询时提供一些相关邮件作为上下文,从而更好地插入特定细节,如作者的联系信息或常用的Zoom链接。
地址:https://github.com/IST-DASLab/PanzaMail
✨ 6: Easydict
macOS 设计的简洁易用的词典翻译应用
Easydict 是一个为 macOS 设计的简洁易用的词典翻译应用。它提供了便捷的查询单词或翻译文本的功能,支持多种输入方式,如输入翻译、划词翻译和 OCR 截图翻译。Easydict 能够自动识别输入文本的语言,并支持多个翻译服务,包括有道词典、苹果系统词典、苹果系统翻译、OpenAI、Google 翻译等。Easydict 开箱即用,用户可以轻松地在不同翻译服务之间切换,根据需要选择最满意的翻译结果。
地址:https://github.com/tisfeng/Easydict
更多AI工具,参考国内AiBard123,Github-AiBard123
广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:1752338621