AI 新工具

AI新工具(20240723) Meta 明天可能发布Llama 3.1;浙大开源Prompt-Singer歌唱声音合成模型;AI一键注释和代码转换;生成、测试和评分GPT提示的工具





Meta 明天可能发布 Llama 3.1 405B 模型

Llama 3.1 基准测试的表现强于OpenAI 的GPT-4o。

✨ 1: Prompt-Singer

Prompt-Singer是一种通过自然语言提示来控制歌唱声音合成的模型。

Prompt-Singer 是一个可控的歌声音频合成模型,由浙江大学的研究团队开发。通过自然语言提示,Prompt-Singer 可以控制歌手的性别、音量和音域,从而生成符合特定要求的歌声音频。这个模型采用 PyTorch 实现,并使用了经过微调的 FLAN-T5 用作主要技术框架。

音乐制作:音乐制作人和作曲家可以使用 Prompt-Singer 来生成特定风格和要求的歌声,以便快速制作音乐样本或完整作品。 配音和多媒体制作:在电影、电视剧或动画中,根据角色需求生成符合情节的歌声,增强视听效果。 声音艺术:声音艺术家可以利用这个工具创造新的声音作品,探索音乐和语音合成的创新可能性。 智能助手和虚拟角色:为智能助手或虚拟角色制作特定语感和风格的歌声,提高互动体验。 教育和训练:在音乐教育和训练中,生成具有特定特点的歌声用作学习材料或练习范本。

地址:https://github.com/cyanbx/Prompt-Singer

✨ 2: aide

Aide 是 VSCode 中一键注释和代码转换的高效工具。

Aide是一个在VSCode中使用的工具,它旨在通过一键注释和代码转换功能帮助用户掌握各种复杂代码。这款工具提供了一些十分实用的功能,包括:

代码转换:支持一键在不同编程语言之间转换代码。 代码注释:可以一键添加详细的注释,让代码更易读。 快速复制:可以批量复制文件/文件夹作为AI提示。 自定义命令:在选定的文件上执行自定义AI命令。 变量重命名:使用AI推荐的变量名重命名变量。 提示模板:定义灵活的AI提示模板。 多文件支持:支持选择多个文件/文件夹进行AI提示或命令。 忽略模式:利用自定义的glob规则排除文件/文件夹。 快捷键:设置自定义快捷键以便快速使用功能。

地址:https://github.com/nicepkg/aide

✨ 3: gpt-prompt-engineer

gpt-prompt-engineer 是一个生成、测试和评分GPT提示的工具,提升任务效果。

gpt-prompt-engineer是一个旨在优化GPT提示生成的工具。其工作原理是通过提供任务描述和测试用例,系统生成、测试并排名多种提示,以找到表现最佳的提示。这个过程利用了GPT-4、GPT-3.5-Turbo或Claude 3 Opus模型,并提供了一种自动生成测试用例和允许用户定义多个输入变量的功能,从而增强了灵活性和效率。

地址:https://github.com/mshumer/gpt-prompt-engineer

✨ 4: Live_Portrait_Monitor

Live_Portrait_Monitor是一款用于实时人像生成和监控的工具。

Live_Portrait_Monitor 这是一款基于实时人像动画效果的工具,可以通过摄像头或监视器的输入,将静态图像生成动态的动画效果。该项目主要参考了论文 “LivePortrait: Efficient Portrait Animation with Stitching and Retargeting Control” 并集成了多种开源技术如FOMM、Open Facevid2vid等。项目的目标是为研究提供一个高效、易于使用的实时人像动画生成框架。

视频会议和直播:在不影响原始视频流的情况下,可以为在线会议和直播添加虚拟背景或特效。 娱乐和社交媒体:用户可以在社交媒体平台上分享动态人像视频,增加互动性和趣味性。 虚拟助手和教育:在虚拟助手或在线教育应用中,使用动态人像可以提高用户体验和参与度。 广告和营销:动态人像可以用于创作更具吸引力的广告和营销内容。 视频编辑和特效制作:为视频编辑和特效制作提供更多创意和高效的工具。

地址:https://github.com/Mrkomiljon/Live_Portrait_Monitor

✨ 5: ComfyUI-B-LoRA

ComfyUI-B-LoRA 是一个加载并应用B-LoRA模型的定制节点,可以实现高质量的风格内容混合。

B-LoRA(Implicit Style-Content Separation using B-LoRA)是一种将单一图像隐式地分解为其样式和内容表示的方法。它可以高质量地进行样式和内容的混合,甚至可以在两个风格化的图像之间交换样式和内容。

地址:https://github.com/liusida/ComfyUI-B-LoRA



更多AI工具,参考国内AiBard123Github-AiBard123 公众号:每日AI新工具

可关注我们的公众号:每天AI新工具

广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:1752338621