AI 新工具

AI新工具(20240627)





✨ 1: 梗图生成器

@fabianstelzer 在Glif做的一个超强meme生成器

Glif 是一个工作流,能生成文字图片和视频,用工作流的形式可以完成很多的花样来。

最近爆红的梗图生成器,WOJAK MEME GENERATOR ,也是用工作流的形式来生成这些有意思的图片,工作流的流程也比较简单:

用一段提示词来生成 关于 我们输入的这个词的梗,比如我们的输入词为 厦门人 ,提示词如下:

You are simulating a most unhinged Wojak meme creator that is specialized in the format of depicting a character with a surrounding tag cloud of text in the style of "sh*t xyz says". You output JSON like so, here is an example of the input "economist": 

{
  "headline": "THE ECONOMIST",
  "text1": ""recession in 2 weeks" -- been in recession for 15 years",
  "text2": ""housing market crash in 2 weeks" -- applies efficient market hypothesis",
  "text3": ""GDP is real" -- Markets haven't been real in 15 years",
  "text4": ""China collapsing in two weeks"",
  "text5": ""33,000,000 jobs added this quarter"",
  "text6": ""A.I. replacing humanity in two weeks"",
  "text7": "cryptocurrency going to 0 in two weeks",
  "text8": "Inflation up 6.66%",
  "image": "smug economist grinning"
  }
  
You get the point! Add "--" between the two statements / duplets.


Now do JSON for the input: 厦门人

We've been asked to make this one extra spicey. When the input contains more than just a concept / profession / person, use that context, but don't bloat the headline with it. Make sure to have the image idea include something specific about the roasted profession or concept.Please return text1-8 in Chinese, and the Image ideas must in English. Start with { just go:

如果用gpt 来生成答案:

{
  "headline": "厦门人",
  "text1": "\"厦门的房价永远不会跌\" -- 房价跌了三年",
  "text2": "\"厦门是最适合人居的城市\" -- 夏天热得像火炉",
  "text3": "\"厦门的海鲜最鲜美\" -- 从来没吃过新鲜的",
  "text4": "\"鼓浪屿是最美的岛\" -- 被游客挤爆",
  "text5": "\"厦门的交通很方便\" -- 堵车堵到怀疑人生",
  "text6": "\"厦门人很热情\" -- 服务员冷冰冰",
  "text7": "\"厦门的空气特别好\" -- 雾霾天越来越多",
  "text8": "\"厦门是个大城市\" -- 一出市区就是农村",
  "image": "smug Xiamen local with Gulangyu Island in the background"
}

确实是挺有意思的梗,gpt也生成了图片的提示词:smug Xiamen local with Gulangyu Island in the background

用这个提示词,用图片生成器生成一张比较搞笑的图片,在把图片和文字拼接起来就成了最后的这种图。

原理非常简单,实现工作流的开源项目有很多,一开始是居于文本api的调用,现在很多的工作流也支持图片和文本的编写,接下来会发展到视频的工作流。

地址:https://glif.app/@fab1an/glifs/clxtc53mi0000ghv10g6irjqj

✨ 2: ElevenLabs Reader App

ElevenLabs Reader App使用高质量语音,帮助您随时随地聆听各种文本内容。

ElevenLabs Reader App 是一款能够随时随地用高质量语音朗读任何文本内容的应用程序。用户可以选择一个语音,从丰富的语音库中上传文章、PDF、电子书(ePub)、新闻通讯或其他文本内容,然后随时随地聆听。这款应用目前在美国、加拿大和英国的iOS设备上可用,其他地区可以预订。它支持朗读各类文章、电子邮件、PDF等,并提供三个月的免费试用期,用户可以享受几乎无限的生成和最高质量的语音服务。用户还可以通过加入候补名单及时了解应用在其设备和国家发布的消息。

地址:https://elevenlabs.io/text-reader

✨ 3: ComfyUI-Fast-Style-Transfer

ComfyUI-Fast-Style-Transfer 是一个用于快速风格迁移的 ComfyUI 节点。

ComfyUI-Fast-Style-Transfer 是一个用于快速神经风格转移的 ComfyUI 节点。此项目基于 https://github.com/rrmina/fast-neural-style-pytorch 进行了简单的转换,目前仅移植了基本的推理功能。

艺术创作:可以快速将照片或图像转化为具有特定艺术风格的作品,适合艺术家、设计师等创意工作者使用。 图像增强:通过风格转移技术,可以增强照片的视觉效果,使其更加吸引人。 学术研究:研究神经网络风格转移的原理和应用。

地址:https://github.com/zeroxoxo/ComfyUI-Fast-Style-Transfer

✨ 4: ControlFlow

ControlFlow 是一个用于构建AI工作流的Python框架,结合任务、代理和流程管理。

ControlFlow是一个用于构建智能代理AI工作流的Python框架。

ControlFlow为定义工作流和委派任务给大型语言模型(LLM)提供了一个结构化、以开发者为中心的框架,而不会牺牲控制权或透明度:

创建离散、可观察的任务(tasks)供AI解决。 为每个任务分配一个或多个专门的AI代理(agents)。 将任务组合成一个流(flow)以协调更复杂的行为。

这种以任务为中心的方法使你可以将AI的强大功能应用于复杂的工作流,同时保持细粒度的控制。通过为每个任务定义明确的目标和约束,可以平衡AI自主性与精准监管,让你有信心构建复杂的AI应用。

地址:https://github.com/PrefectHQ/ControlFlow

✨ 5: swiftLLM

SwiftLLM是一个仅有2000行代码的小型强大LLM推理系统,专为研究用途设计。

SwiftLLM是一个小而强大的大型语言模型(LLM)推理系统,专门为研究目的设计。尽管其代码量仅为vLLM的2%(约2k行代码),SwiftLLM能够实现与vLLM相当的性能。

地址:https://github.com/interestingLSY/swiftLLM



更多AI工具,参考国内AiBard123Github-AiBard123 公众号:每日AI新工具

可关注我们的公众号:每天AI新工具

广告:私人定制视频文本提取,字幕翻译制作等,欢迎联系QQ:1752338621