AI新工具(20240507) OpenAI API搭建的智能家居助手;私密大型语言模型(LLM)聊天机器人;视频和音频文件的自动化识别和翻译工具
✨ 1: GPT Home
基于Raspberry Pi和OpenAI API搭建的智能家居助手
GPT Home是一个基于Raspberry Pi和OpenAI API搭建的智能家居助手,功能上类似于Google Nest Hub或Amazon Alexa。通过详细的设置指南和配件列表,用户可以自行组装和配置这个设备,实现语音控制和智能家居管理的功能。
核心功能
- 语音互动: 用户可以通过语音与GPT Home互动,询问天气、新闻、日历等信息。
- 智能控制: 通过集成其他API和智能设备,如Spotify、Phillips Hue灯泡等,GPT Home能够控制家中的智能设备,实现灯光调节、音乐播放等功能。
- 家庭助理: 设置提醒、闹钟、计时器,以及其他日常生活中的助理功能。
- 教育娱乐: 提供互动游戏、教育内容,适合全家人使用。
GPT Home的搭建基于Ubuntu Server操作系统的Raspberry Pi,需要用户按照提供的配件列表购置必要的硬件,包括Raspberry Pi 4B、小型扬声器、OLED显示屏等。随后按照指南配置Wi-Fi、安装系统依赖、配置开机自启等步骤逐步完成。整个搭建过程需要一定的电脑操作能力,但教程提供了详细的指导和示例脚本,用户可以通过跟随教程逐步实施。
地址:https://github.com/judahpaul16/gpt-home
✨ 2: Secret Llama
在浏览器中运行的私密大型语言模型(LLM)聊天机器人
Secret Llama是一个完全在浏览器中运行的私密大型语言模型(LLM)聊天机器人,它支持Llama 3、Mistral等开源模型。借助于webllm提供的推理引擎,Secret Llama可以在不需要服务器和安装的情况下提供与ChatGPT相媲美的用户体验,并且还能够离线使用。最大的卖点是其绝对的隐私性 —— 任何对话数据都不会离开你的电脑。 Secret Llama是一个面向隐私保护、便捷性和开源爱好者的大型语言模型聊天机器人解决方案,适用于各种希望在保证数据隐私的前提下使用或探索LLM的场景。
地址:https://github.com/abi/secret-llama
✨ 3: Chenyme-AAVT
用于视频和音频的自动识别与翻译
Chenyme-AAVT(AI Auto Video-Audio Translation)是一个针对视频和音频文件的自动化识别和翻译工具。它允许用户快速将视频或音频中的语言内容识别出来,并转换成所需的目标语言字幕,再将这些字幕合并回原视频或与之配合使用。
主要功能:
- 全自动识别和翻译: 对视频或音频中的语言内容进行自动识别和翻译,生成字幕文件。
- 支持多种语言和模型: 支持多种语言识别和翻译,以及使用不同的模型,如推荐使用
faster-whisper
和大型模型以获得更佳体验。 - GPU加速和VAD辅助: 支持GPU加速以提高处理速度,同时利用语音活动检测(VAD)辅助识别以提升准确性。
- 多种字幕格式输出和预览: 支持输出多种字幕格式,并提供字幕预览以及视频预览功能。
- 高级功能: 支持字幕编辑、二次精翻,以及视频内容的总结和问答等AI辅助功能。
地址:https://github.com/Chenyme/Chenyme-AAVT
✨ 4: DeepSeek-V2
先进的混合专家(Mixture-of-Experts,简称MoE)语言模型
DeepSeek-V2是一个先进的混合专家(Mixture-of-Experts,简称MoE)语言模型,它在训练和推理方面均体现出经济高效的特点。总的来说,DeepSeek-V2的关键特性包括其强大的性能、经济的训练成本、以及高效的推理能力。下面用通俗的语言对DeepSeek-V2的功能进行详细总结,并说明使用DeepSeek-V2的情况。
聊天模型地址:https://huggingface.co/deepseek-ai/DeepSeek-V2-Chat 基础模型:https://huggingface.co/deepseek-ai/DeepSeek-V2
地址:https://github.com/deepseek-ai/DeepSeek-V2
✨ 5: LangChain Swift
为iOS、macOS、watchOS 开发的LangChain 的Swift库
LangChain Swift是一个为iOS、macOS、watchOS(部分支持)以及visionOS(测试版)优化的Swift库,它使得在这些平台上使用语言模型变得简单。
LangChain Swift是一套强大的工具集,它使得在苹果的多个平台上整合和使用语言模型变成可能。无论你是想要构建一个简单的聊天机器人,还是开发一个复杂的基于AI的应用程序,LangChain Swift都提供了必要的工具和接口。
地址:https://github.com/buhe/langchain-swift
更多AI工具,参考国内AiBard123,Github-AiBard123
广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:1752338621