AI新工具(20240528) AI手语研究数据集;视频转视频翻译和风格化功能如黏土动画;AI检测猫咪行为
✨ 1: Prompt2Sign
多语言手语数据集,便捷高效用于手语研究。
Prompt2Sign 是一个全面的多语言手语数据集,旨在通过工具自动获取和处理网络上的手语视频。该数据集具有高效、轻量的特点,旨在减少先前手语数据集的不足之处。该数据集目前包含美国手语(ASL)、德国手语(GSL/DGS)、瑞士德语手语(DSGS)、瑞士法语手语(LSF-CH)、瑞士意大利手语(LIS-CH)、阿根廷手语(LSA)、韩国手语(KSL)和土耳其手语(TSL)。
Prompt2Sign为手语生成和识别的研究提供了丰富的数据资源,是推动手语领域研究和应用的重要工具。用于研究时请引用以下论著:
地址:https://github.com/SignLLM/Prompt2Sign
✨ 2: StreamV2V
RTX 4090上实现实时的视频转视频翻译和风格化功能
StreamV2V是一种用于视频到视频(video-to-video)转化的实时处理系统。该系统通过特征库(feature banks)实现高效的实时视频转化,并支持在一台RTX 4090 GPU上运行。这一技术能够进行例如人脸替换(例如替换为Elon Musk或Will Smith)和视频风格化(例如变成黏土动画或涂鸦艺术)等功能。
通过这些功能和使用场景,StreamV2V展示了其在视频内容创作和实时处理方面的强大潜力。
地址:https://github.com/Jeff-LiangF/streamv2v
✨ 3: Perplexica
开放源码的AI驱动搜索引擎,提供准确且最新的搜索结果
Perplexica 是一个开源的AI驱动搜索引擎,能够深入互联网寻找答案。灵感来自Perplexity AI,Perplexica不仅进行网络搜索,还能理解用户的问题。它利用先进的机器学习算法如相似度搜索和嵌入技术来优化搜索结果,并提供带有引文的清晰答案。使用SearxNG确保信息的实时性和开放性,且不影响用户隐私。
地址:https://github.com/ItzCrazyKns/Perplexica
✨ 4: LlamaFS
自动重命名和组织文件的自组织文件管理器,支持多种文件类型
LlamaFS 是一个自动化的文件管理工具,通过基于文件内容和常见的命名约定(例如,时间)来自动重命名并组织文件,它可以处理多种类型的文件,包括图像(通过 Moondream 处理)和音频(通过 Whisper 处理)。
LlamaFS 主要有两个运行模式:批处理模式和监控模式。
- 批处理模式:用户可以运行一个批处理任务,自动批量重命名和组织目录中的文件。
- 监控模式:LlamaFS 作为守护进程运行,实时监控目录中的文件操作,根据用户最近的编辑行为进行预测和自动分类。例如,如果用户创建了一个 2023 年的税务文件夹并开始将相关文件移动到该文件夹中,LlamaFS 会自动创建并将合适的文件移动到相应位置。
地址:https://github.com/iyaja/llama-fs
✨ 5: AI Raspberry Pi Cat Detection
用树莓派和AI检测猫咪行为,违规时发送通知并进行语音叙述
AI Raspberry Pi 猫咪检测和通知系统:当你的猫做了一些不该做的事情时,它可以给你发送短信或电子邮件通知,并且可以用AI讲述它所看到的内容 👁️
这个Raspberry Pi入门套件让使用AI变得简单(既可以运行设备模型,也可以调用大型语言模型),并且它在其他与视觉相关的用例中也是通用的。
地址:https://github.com/ykhli/AI-RPi-detection
更多AI工具,参考国内AiBard123,Github-AiBard123
广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:1752338621