AI 文摘

AI绘图工具Ideogram10发布!文字生成效果还是很牛的


  • By AiBard123
  • February 29, 2024 - 2 min read



作者: 小麦AIGC 来源: 小麦AIGC

但仅限英文或拼音,不支持中文。

看产品先看名字,这家公司/产品的名字很有意思:Ideogram

可以看做是三个单词的组合:Idea+program+instagram(想法+程序+照片分享),这是一个通过想法创意来生成优质图像的技术公司。

你只要打开该公司的网站,就可以非常清晰地感受到一种Ins风。

https://ideogram.ai/

昨天Ideogram发布了其1.0正式版模型,是从头开始训练的,提供照片级真实感的图像生成,有非常棒的文字渲染效果,在提示词遵循效果上也非常优秀。相比较之前的0.1和0.2初始版本有了巨大提升。

大家可以先简单看下图像生成效果:

Magic Prompt

接下来介绍一个有意思的小功能:Magic Prompt(魔法提示词),它可以自动地将你的提示词进行扩充。

如下图,通过一句简单的提示让Ideogram生成一张关于猫的meme(模因,类似梗图),它会自动在提示中增加文字描述的部分,以实现你想要的效果,跟DALL-E的能力是类似的。

文字生成

然后我们重点测试文字生成能力,这也是Ideogram官方主打的能力,先看一下官方宣传视频:

好的,接下来实际测试。

先试一下中文

a boy wears a t-shirt says “中华精神”

中文完全无法生成,但是如果你启用了Magic Prompt功能,系统会将中文翻译为英文再生成出来。

但这也许对国内厂商是个机会,只要有足够的中文图像的训练数据,总能解决中文生成的问题。

前段时间阿里提出的AnyText技术也在解决这个问题,感兴趣的可以关注下。

接下来测试英文短语

中国(英文)

a boy wears a t-shirt with words “china”

照片质感非常好,文字也非常贴合衣服褶皱。

接下来试一下比较长的短语

全村的希望(英文)

a 20-year-old girl wears a t-shirt with words “Hope of the whole village”, 3d render

生成图片的内容场景是跟文字有关系的,这里的背景是一个村寨。

全市的希望(英文)

a 20-year-old girl wears a t-shirt with words “Hope of the whole city”, 3d render

这里的背景是城市街道,而且正确地突出了Hope和City两个关键词。

全村的希望(汉语拼音)

a 20-year-old girl wears a t-shirt with words “Quan Cun de Xi Wang”, 3d render

很明显模型识别到了这是汉语拼音,所以背景是中国风的,招牌上还写着类似中文的字样。

接下来测试一些常用词/品牌词

苹果(英文)

a 20-year-old girl wears a t-shirt with words “Apple”, 3d render, photo

可以注意到,提示词中并未说明这里的Apple是苹果,只是将A大写,自动生成了苹果的logo。

小米(汉语拼音)

a 20-year-old girl wears a t-shirt with words “Xiaomi”, photo, cinematic

注意这次生成的是一个中国女孩,受Xiaomi词语影响还是比较大的。

中国龙是Loong(英文)

a 20-year-old girl wears a t-shirt with words “Chinese Dragon is Loong”, photo, cinematic

让我们换个场景,在书本上生成文字

The cover of a book on the table reads “Chinese Dragon is Loong”, photo, cinematic

再试一个长句子

敏捷的棕毛狐狸跃过一只懒狗(英文)

The cover of a book on the table reads “The quick brown fox jumps over a lazy dog”, photo, cinematic

场景改为书本内页

one page of a book on the table reads “The quick brown fox jumps over a lazy dog”

增加两处文字

one page of a book on the table reads “The quick brown fox jumps over a lazy dog”, some words below “xiaomai”

总结一下:

  • 在引号里的文字会影响生成内容,如果你要生成的文字与它的表面意义相差较大,建议是在提示词中进行注明;

  • 越短、越常用的词越不容易出错;

  • 越长的文字、一张图上使用文字的部分越多生成出错的概率越大,可以多试几次;

  • 场景不合适也不行,比如你让一本书的标题非常长就可能容易出错,因为训练数据里面的书名长度大多数都比较短,这个时候可以换成书本内页,内页出错的概率就更低。

以上就是Ideogram 1.0的重点内容,感兴趣的小伙伴可以亲自上手试一下,每天免费使用25个提示词生成。

https://ideogram.ai/

参考资料

https://about.ideogram.ai/1.0

推荐阅读

阿里巴巴提出可视文本生成技术AnyText,可无缝集成到扩散模型,以在图像中准确生成文字

END

如果喜欢上面的内容,请关注小麦AIGC,最新内容每日更新;如有好的选题建议,也可以给我们发消息哦。

点个在看,你最好看

更多AI工具,参考Github-AiBard123国内AiBard123

可关注我们的公众号:每天AI新工具