AI新工具(20240210) Osam - Osam是一个启用本地运行的开源“一切分割”模型工具,支持多种接口和自定义视觉模型
Osam - Osam是一个启用本地运行的开源“一切分割”模型工具,支持多种接口和自定义视觉模型。
Osam是一个开源工具,它允许本地运行“可对任何内容进行分割”的模型(Segment-Anything Models),灵感来源于Ollama。使用Osam,用户可以在本地环境中,而不是依赖于云服务,对图片进行内容分割。这种方法有助于保护数据隐私,同时也减少了因网络延迟可能产生的处理时间。
https://github.com/wkentaro/osam
Whishper - Whishper是一个开源的、100%本地化的音频转录和字幕制作套件,具备完整的网络界面。
Whishper是一个开源的本地音频转写和字幕套件,具备完整的网页用户界面(UI)。它可以将任何媒体(如音频、视频等)通过URL或者上传文件的方式转化为文字,并支持多种格式(TXT,JSON,VTT,SRT)的下载,用户还可以直接复制原始文本到剪贴板。Whishper还具备强大的字幕编辑器,让用户可以在同一界面进行翻译、编辑和调整字幕。
https://github.com/pluja/whishper
Edgen - Edgen是一个本地GenAI API服务器,为本地GenAI提供OpenAI API的替代,支持文本生成、语音转文本等功能,并能在Windows、Linux和MacOS上免费、保护数据隐私地运行。
Edgen是一个本地化的、针对个体设备的通用人工智能(GenAI)API服务器,它可以作为OpenAI API的直接替代品。Edgen的主要特点是它允许在用户的设备上本地运行,确保了数据隐私的同时,无需外部云计算资源,减少了对网络的依赖,同时提高了可扩展性和可靠性。
使用Edgen,开发者可以在多个平台(包括Windows、Linux和macOS)上利用各种AI模型(如文本生成、语音识别等)为他们的应用提供强大的AI功能。Edgen支持多种AI模型和端点,比如LLMs(大型语言模型)、Speech-to-text(Whisper)等,并且具有模型和运行时的模块化和优化特性。
https://github.com/edgenai/edgen
HongHongAI - HongHongAI是一个基于Google的gemini大模型、借鉴哄哄模拟器概念的开源免费版本,通过原始提示实现功能,技术栈包括Next.js、Vercel AI SDK、TailwindCSS等,支持通过环境变量配置,鼓励社区贡献,并基于MIT许可证开源。
HongHongAI是一个由开源社区开发的,旨在模仿和改进原有的哄哄模拟器(Hong Hong Simulator)的工具。本质上,它是一个使用谷歌的Gemini语言模型来生成回复的聊天机器人。以下是对其主要功能、技术栈、使用场景以及如何参与贡献的通俗概述。
https://github.com/johanazhu/honghongai
更多AI工具,参考国内AiBard123,Github-AiBard123
广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:1752338621