AI绘图工具Ideogram10发布!文字生成效果还是很牛的
作者: 小麦AIGC 来源: 小麦AIGC
但仅限英文或拼音,不支持中文。
看产品先看名字,这家公司/产品的名字很有意思:Ideogram
可以看做是三个单词的组合:Idea+program+instagram(想法+程序+照片分享),这是一个通过想法创意来生成优质图像的技术公司。
你只要打开该公司的网站,就可以非常清晰地感受到一种Ins风。
昨天Ideogram发布了其1.0正式版模型,是从头开始训练的,提供照片级真实感的图像生成,有非常棒的文字渲染效果,在提示词遵循效果上也非常优秀。相比较之前的0.1和0.2初始版本有了巨大提升。
大家可以先简单看下图像生成效果:
Magic Prompt
接下来介绍一个有意思的小功能:Magic Prompt(魔法提示词),它可以自动地将你的提示词进行扩充。
如下图,通过一句简单的提示让Ideogram生成一张关于猫的meme(模因,类似梗图),它会自动在提示中增加文字描述的部分,以实现你想要的效果,跟DALL-E的能力是类似的。
文字生成
然后我们重点测试文字生成能力,这也是Ideogram官方主打的能力,先看一下官方宣传视频:
好的,接下来实际测试。
先试一下中文
a boy wears a t-shirt says “中华精神”
中文完全无法生成,但是如果你启用了Magic Prompt功能,系统会将中文翻译为英文再生成出来。
但这也许对国内厂商是个机会,只要有足够的中文图像的训练数据,总能解决中文生成的问题。
前段时间阿里提出的AnyText技术也在解决这个问题,感兴趣的可以关注下。
接下来测试英文短语
中国(英文)
a boy wears a t-shirt with words “china”
照片质感非常好,文字也非常贴合衣服褶皱。
接下来试一下比较长的短语
全村的希望(英文)
a 20-year-old girl wears a t-shirt with words “Hope of the whole village”, 3d render
生成图片的内容场景是跟文字有关系的,这里的背景是一个村寨。
全市的希望(英文)
a 20-year-old girl wears a t-shirt with words “Hope of the whole city”, 3d render
这里的背景是城市街道,而且正确地突出了Hope和City两个关键词。
全村的希望(汉语拼音)
a 20-year-old girl wears a t-shirt with words “Quan Cun de Xi Wang”, 3d render
很明显模型识别到了这是汉语拼音,所以背景是中国风的,招牌上还写着类似中文的字样。
接下来测试一些常用词/品牌词
苹果(英文)
a 20-year-old girl wears a t-shirt with words “Apple”, 3d render, photo
可以注意到,提示词中并未说明这里的Apple是苹果,只是将A大写,自动生成了苹果的logo。
小米(汉语拼音)
a 20-year-old girl wears a t-shirt with words “Xiaomi”, photo, cinematic
注意这次生成的是一个中国女孩,受Xiaomi词语影响还是比较大的。
中国龙是Loong(英文)
a 20-year-old girl wears a t-shirt with words “Chinese Dragon is Loong”, photo, cinematic
让我们换个场景,在书本上生成文字
The cover of a book on the table reads “Chinese Dragon is Loong”, photo, cinematic
再试一个长句子
敏捷的棕毛狐狸跃过一只懒狗(英文)
The cover of a book on the table reads “The quick brown fox jumps over a lazy dog”, photo, cinematic
场景改为书本内页
one page of a book on the table reads “The quick brown fox jumps over a lazy dog”
增加两处文字
one page of a book on the table reads “The quick brown fox jumps over a lazy dog”, some words below “xiaomai”
总结一下:
-
在引号里的文字会影响生成内容,如果你要生成的文字与它的表面意义相差较大,建议是在提示词中进行注明;
-
越短、越常用的词越不容易出错;
-
越长的文字、一张图上使用文字的部分越多生成出错的概率越大,可以多试几次;
-
场景不合适也不行,比如你让一本书的标题非常长就可能容易出错,因为训练数据里面的书名长度大多数都比较短,这个时候可以换成书本内页,内页出错的概率就更低。
以上就是Ideogram 1.0的重点内容,感兴趣的小伙伴可以亲自上手试一下,每天免费使用25个提示词生成。
参考资料
推荐阅读
阿里巴巴提出可视文本生成技术AnyText,可无缝集成到扩散模型,以在图像中准确生成文字
END
如果喜欢上面的内容,请关注小麦AIGC,最新内容每日更新;如有好的选题建议,也可以给我们发消息哦。
点个在看,你最好看
更多AI工具,参考Github-AiBard123,国内AiBard123