AI新工具(20240819) Chatbase替代方案Chatsage;LLM辅助的OCR;人工生命模拟工具alien
✨ 1: chatsage
Chatsage是一个开源的AI聊天机器人,适用于网站,提供Chatbase替代方案。
Chatsage是一款开源的AI聊天机器人,旨在为用户提供简便易用的在线聊天体验。它是Chatbase的一个替代方案,适用于各种网站。该项目采用了现代的技术栈,包括Next.js、Supabase和Tailwind CSS等,拥有灵活的自托管和云托管选项,让开发者能够根据需求进行定制和扩展。
Chatsage凭借其开源特性和高度的可定制性,适用于各类网站,能够提升用户体验并提高服务效率。
地址:https://github.com/taishikato/chatsage
✨ 2: LLM-Aided OCR
LLM辅助的OCR项目旨在利用大型语言模型提升光学字符识别的准确性和可读性。
LLM辅助OCR(光学字符识别)项目是一个先进的系统,旨在显著提高OCR输出的质量。该项目利用最前沿的自然语言处理技术和大型语言模型(LLMs),将原始的OCR文本转化为高准确度、格式良好且可读性强的文档。
PDF转图像:将PDF文件转换为图像以便进行OCR识别。 使用Tesseract进行OCR:提取图像中的文本。 使用LLMs进行高级错误修正:通过本地或API调用的方式对OCR输出进行精修。 智能文本分块:将文本分割成可处理的块,以提高处理效率。 Markdown格式选项:将文本转化为一致的Markdown格式。 质量评估:对最终输出进行质量评估。 支持本地LLMs和云端API供应商:如OpenAI和Anthropic。 异步处理:提高处理性能。
通过结合OCR技术和大型语言模型的优势,LLM辅助OCR项目能够大幅提升文本处理的质量和效率,适用于各种需要文本识别和处理的场景。
地址:https://github.com/Dicklesworthstone/llm_aided_ocr
✨ 3: alien
ALIEN是一个基于CUDA的人工生命模拟工具,允许用户探索和创建复杂的数字生命形式。
ALIEN(人工生命环境)是基于CUDA的专用2D粒子引擎开发的人工生命模拟工具。它通过模拟网络化的粒子来创建软体和流体的虚拟生物体,这些生物体可以被赋予更高级的功能,如信息处理、传感器、肌肉、武器等,由神经网络来协调其执行。每个生物体都可以视作在共享环境中操作的数字生物,且其设计蓝图可以储存在基因组中并传递给后代。
物理和图形引擎:支持软、刚体力学、流体、热量散失和损害等模拟,能够进行实时用户交互。 人工生命引擎扩展:可模拟多细胞生物,通过基因系统和细胞构建后代,利用神经网络控制更高级的功能。 丰富的编辑工具:提供图形编辑器、自由手绘和几何绘图工具,以及基因编辑器用于设计定制生物。 联网功能:内置模拟浏览器,支持上传和下载模拟文件。
地址:https://github.com/chrxh/alien
✨ 4: Linly-Dubbing
Linly-Dubbing是一款智能视频多语言配音和翻译工具,融合了AI技术,为用户提供自然流畅的多语言视频体验。
Linly-Dubbing
是一款智能视频多语言AI配音和翻译工具,旨在通过先进的人工智能技术提高视频配音的质量与自然度。该工具以多语言支持为核心,结合语音识别、大型语言模型翻译及声音合成等技术,为用户提供高质量的配音服务。同时,Linly-Dubbing
还整合了数字人对口型技术,使得配音与视频画面高度契合,提升了观众的观看体验。
地址:https://github.com/Kedreamix/Linly-Dubbing
✨ 5: Khoj
Khoj是一款开源个人AI应用,帮助用户扩展数字记忆和能力,支持各种文件和平台。
Khoj 是一个开源的个人人工智能应用,旨在帮助用户扩展其数字能力。它能够创建随时可用的个人 AI 代理,允许用户分享笔记和文档,从而增强他们的数字记忆。Khoj 的 AI 代理可以访问互联网,集成实时信息,支持在桌面、Emacs、Obsidian、网页和 WhatsApp 等多种平台上使用。用户还可以分享 PDF、Markdown、Org-mode、Notion 文件及 GitHub 仓库,享受快速准确的语义搜索。
学习和研究:用户可以将学习资料和研究文档上传到 Khoj,利用其智能搜索功能快速找到相关信息。 知识管理:对于需要管理大量笔记和文档的用户,Khoj 提供了有效的归档和检索机制,提高信息的可使用性。 实时信息整合:通过互联网访问,用户可以获取实时更新的信息,增强其决策支持。 个性化体验:Khoj 能够生成个性化的图像和理解用户的语音,提供更贴心的使用体验。
地址:https://github.com/khoj-ai/khoj
✨ 6: MooER
MooER(摩耳)是Moore Threads开发的基于LLM的语音识别与翻译模型,支持中英文转录与翻译。
MooER(摩耳)是由Moore Threads开发的一种基于大语言模型(LLM)的语音识别和翻译模型。该模型能够实现自动语音转写(ASR)和自动语音翻译(AST),并且在单一的端到端框架内完成。这一创新使得用户可以方便地将语音转换为文本,同时将语音翻译成其他语言。
语音转写:MooER可以帮助用户将语音内容转化为文本,适用于会议记录、自动字幕生成等场景。 跨语言沟通:通过其翻译功能,MooER能够将一种语言的语音内容即时翻译成另一种语言,非常适合应用于国际会议、在线翻译服务等领域。 多任务操作:用户可以同时进行语音转写和翻译,极大提升工作效率,适用于需要双语或多语言处理的用户场景。 教育领域:MooER还可以在语言学习、线上课程中应用,帮助学生提高听说能力,以及进行实时翻译。
MooER的开发是完全依赖于国内的S4000 GPU,标志着在国产硬件上成功实现了高级别的语音处理能力。
地址:https://github.com/MooreThreads/MooER
✨ 7: OpenVoiceChat
OpenVoiceChat 是一个开源项目,支持与大型语言模型进行自然语音对话。
OpenVoiceChat 是一个开源项目,旨在与大型语言模型(LLM)进行自然的语音对话。该项目通过提供接口,支持多种语音识别(STT)、语音合成(TTS)和语言模型,使得用户能够轻松实现语音交互。
用户需要先安装相关的依赖包,然后运行主程序,即可开始使用 OpenVoiceChat 进行语音对话。该项目旨在提供一个开放的替代品,以挑战闭源的商业实现,具有良好的可扩展性和易用性。
地址:https://github.com/Finity-Alpha/OpenVoiceChat
✨ 8: PankoGPT
PankoGPT是一个支持Discord和Telegram等平台的AI机器人管理工具,简化了自定义机器人的创建和管理。
PankoGPT 是一个基于人工智能的机器人管理工具,目前处于测试阶段。它旨在简化 Discord、Telegram 等多种消息平台的机器人创建与管理。用户无需编程技能,只需通过简单的表单填写,便可以部署和定制具有特定目标和行为的机器人。PankoGPT 计划在未来支持包括 Outlook、WhatsApp 和 Facebook 等更多平台。
地址:https://github.com/catalinberta/panko-gpt
更多AI工具,参考国内AiBard123,Github-AiBard123 公众号:每日AI新工具
广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:1752338621