AI新工具(20240708) 快手开源中英双语文本生成图像模型Kolors;漫画翻译工具Comic Translate;支持谷歌搜索、文件网址对话和代码解释的智能对话工具
✨ 1: Kolors
Kolors是基于潜在扩散的大规模中英双语文本生成图像模型。
Kolors是由快手的Kolors团队开发的一种基于潜在扩散的文本到图像生成模型。它经过了数十亿对文本和图像数据的训练,在视觉质量、复杂语义准确性以及中文和英文文本渲染方面都表现出显著的优势。Kolors支持中英文输入,在理解和生成中文特定内容方面有着出色的表现。
人类评价:在50名图像专家的评估中,Kolors在视觉吸引力、文本忠实度和整体满意度方面都获得了最高分。 机器评价:通过多维人类偏好得分(MPS),Kolors在所有参评模型中得分最高,表现一致领先。
地址:https://github.com/Kwai-Kolors/Kolors
✨ 2: Comic Translate
Comic Translate 是一个利用GPT-4翻译漫画和其他类型漫画的项目,支持多种语言。
Comic Translate 是一个漫画翻译项目,旨在利用GPT-4的能力来翻译世界各地的漫画。它不仅仅局限于翻译日漫,还支持其他种类的漫画和多种语言。目前支持从和翻译到以下语言:英语、韩语、日语、法语、简体中文、繁体中文、俄语、德语、荷兰语、西班牙语和意大利语。
漫画翻译:Comic Translate 可以帮助漫画爱好者翻译外国漫画,无需等待官方翻译版本。 跨文化传播:漫画创作者可以将自己的作品翻译成多种语言,扩展全球读者群。 语言学习:语言学习者可以通过漫画的翻译来理解和学习新语言。 学术和研究:翻译漫画中的内容,也有助于学者和研究人员更好地了解其他国家的文化和语言。
地址:https://github.com/ogkalu2/comic-translate
✨ 3: Subtitles by fframes
一款免费的本地AI视频转录工具,带有编辑、样式设计和渲染功能。
Subtitles by fframes 是一个完全免费的,本地化的、基于设备的AI视频转录工具。它配有图形用户界面,用户可以使用它对转录的字幕进行编辑、样式设置,并将字幕渲染到视频中。
地址:https://github.com/dmtrKovalenko/subtitler
✨ 4: ChatPilot
ChatPilot是一个支持谷歌搜索、文件网址对话和代码解释的智能对话工具。
ChatPilot 是一款基于LangChain框架实现的对话代理(Agent)。它能够实现复杂的对话功能,包括联网搜索、文件和网址的解析对话(RAG)以及代码解释器等功能。主要支持OpenAI/Azure API接口,用户可以通过前端界面或命令行进行交互。
ReAct和OpenAI Function Call支持的Agent对话: 查询改写的检索增强(RAG)文件问答:基于LangChain进行实现。 前后端服务分离:前端使用Svelte框架,后端使用FastAPI框架。 多媒体支持:支持语音输入输出和图像生成。 用户管理和权限控制:支持聊天记录的导入导出。
ChatPilot是一款功能强大且易于使用的对话代理工具,其多样化的功能能够适用多种实际应用场景。无论是个人使用还是企业内部应用,ChatPilot都提供了解决方案,让信息获取和交互变得更加智能和高效。
地址:https://github.com/shibing624/ChatPilot
✨ 5: AnyControl
AnyControl是一个支持多种控制信号的文本生成图像框架,可实现高质量和谐图像创作。
AnyControl 是一个由上海人工智能实验室推出的可控图像生成框架,支持各种形式和组合的控制信号。它通过创新的多控制编码器(包括交替的多控制融合块和多控制对齐块)实现对用户复杂多模态输入的综合理解,从而生成高质量和高保真度的和谐图像。
多样化控制:支持各种形式的控制信号,可以组合使用,实现对图像生成的全面控制。 多控制编码器:采用交替的多控制融合块和多控制对齐块,实现用户复杂多模态输入的全面理解。 高质量输出:在多样控制信号下,AnyControl 能够生成高质量和高保真度的图像。
地址:https://github.com/open-mmlab/AnyControl
更多AI工具,参考国内AiBard123,Github-AiBard123 公众号:每日AI新工具
广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:1752338621