AI 文摘

它能帮你顺畅执行工作流,比@GPTs好用100倍





作者: 南瓜博士 来源: 南瓜博士

1 月 30 日晚 10 点,我仍旧没有被灰度到 @GPTs 的功能,决定自给自足。两小时后(在 GPT 的帮助下)功能完成文章写好,喜滋滋发到群里接受大家的赞美。[1]

第二天一觉醒来,OpenAI 已全面放开,我也拿到了 @GPTs 权限。就差这么几小时……
并没有白忙乎。我体验过 OpenAI 的 @GPTs 后,发现还是自己的更好用。今天得闲,迭代了一版。五个优点,让我完全弃用 @GPTs。

优点 1: 可选的 GPTs 范围广

在原生应用里,只有最近用过的若干和被 pin 在左边栏的 GPTs 才能够被 @ 到。如果临时想起用某个 GPTs,要么得 pin 住它,要么得浪费一次对话轮次使得它出现在最近使用的列表里。都不方便。

而用我的小工具,可以 @预先设置好的名称,也可以输入 @g-xxxxxxxxx 的编号,甚至直接输入你想用的 GPTs 的 https 链接,只要是放在最开头,都能被准确识别到。

复制一个已有的链接,这是召唤临时想到的 GPTs 最简单的方式了。我自己习惯的流程是:始终打开一个 Explore GPTs 的窗口,想要做什么就搜一下,然后鼠标右键->复制链接地址,回到对话 thread 粘贴。

对于常用的,则可以设置好简写的名称,用起来会更方便。(& 和 @ 都可以。主要是考虑到输入 @ 就会有 OpenAI 的 GPTs 选择框蹦出来,比较麻烦,所以额外又支持了 &。)

顺带吐槽:OpenAI 不让直接 @任意 GPTs 是因为三百万个 GPTs 搜索性能扛不住吗?它在 @ 功能上哪怕加个点击了才搜的按钮,也比现在无法即兴在对话中召唤任意 GPTs 要好呀。OpenAI 的产品真的是草台班子~~

优点 2: 修改中间的对话也能 @

原生 @GPTs 功能只能在最下方的输入框里用,如果我想修改之前的对话,就无法指定了。
但是,在我的小工具里,不存在这样的困扰:

优点 3:预先设计好工作流,点按钮更方便

@GPTs 的小脚本和 EasyFill 结合起来就更方便了:创建一个功能组,把与特定某件事相关的 GPTs 都放到功能组下,只需要点击按钮就可以依次唤出。[2]

一套好的工作流,不只是操作简单,它总挂在页面右侧,也是在提醒你接下来该做些什么。

而它的实现极其简单:把相对应的 gizmo id 填到模版里就好。

优点 4: 可以局部引用前面的文字

有上下文后 GPTs 能知道前情提要是很好。但如果前面内容过多,想要只关注其中一部分,原生的 @GPTs 就做不到了。EasyFill 可以轻松达成局部强调的效果。

例如上面的“文字配插图”功能组,我通过“提取要素”把卡尔维诺《看不见的城市》的文字交给 @g-rzeBPKJPI,它给出了五个插图方案。然后,我只需要选中偏好的方案,再点击“画插图“按钮。

新的 prompt 自动编辑好发送,冗长的上下文不再是干扰。(感谢 @g-Qs1wbwJEP 的作者林克,超喜欢你这个 Ghost Painter!)

优点 5:输出内容直接点!看我变魔法!

本来只是输出的内容按我要求前后添加了 🏞️ emoji,输出结束后摇身一变变成了可以点击的链接。选中自己喜欢的方案,轻轻一点,给 Ghost Painter 的画插图命令就发送出去了。

几个链接分别点一遍,多张图片刷刷刷就生成了,超方便!

魔法其实很简单:EasyFill 会把符合给定正则表达式的内容,替换可以点击的链接,链接点击后的行为就是填写 prompt 并发送。我要求前一个命令输出内容用 🏞️ 🏞️ 括起来,再设定一个 🏞️(.*?)🏞️ 正则匹配,搞定![3]

一点感想:

从 prompt engineer 到 flow engineer

最后这一个方案,比较接近我期望的人机协作互动了。[4] 去年上半年,我着迷于 prompt engineer,用一段长长的伪代码式的 prompt 让 GPT 完成超复杂的任务,看起来很酷炫。[5]

后来我反思,何必像帕格尼尼用一根琴弦拉小提琴那样炫技,用一串 prompt 更稳定地实现功能不好吗。于是开始研究 agent framework,自己写了个超轻便的,也用过不少很不错(metagpt 很赞)。(刚巧最近一篇 flow engineer 的论文也有提到,多个 prompt 多次生成测试反馈迭代,效果好于精心构造的 prompt 一次生成。我们的侧重点略有差异,但异曲同工。)[6] 再后来,用 agent framework 写小说的过程中[7],我深刻认识到在很长一段时间里,AI 都需要通过与人协作来获得更好的表现:它需要人为它提供很多很多的上下文,很多很多的反馈[8]。对话框,是一种看上去最简陋、其实却最灵活的方案,可以让人与各个 bot 非常自由地穿插着对话。因此,我开始写 EasyFill 等小插件。

最近越来越强烈的感觉——要让 LLM 发挥作用,需要的远不止是理科生思维:用 RAG 提供上下文,用 agent framework 精心设计各 bots 之间的交流,用 生成-测试-反馈-迭代 的流程让 LLM 自行进化……这些都很重要,但文科生的思路也很有价值——比如我之前说的靠(动作)把 LLM 带入该有的氛围,靠 YES-AND 和 LLM 不断推陈出新。一个方便灵活的对话框,是试验这类文科生方法的最佳途径。

不知道接下来 OpenAI 会发布什么,agent transformer 什么时候能到来。等它来了,文科生们的方法就有更多用武之地啦。期待着……

相关阅读

[1] 不等啦!我自己实现了 @GPTs 功能,比原生的更好用
[2] 我写了个超方便的小工具,PROMPT 再复杂也不怕
[3]
用 GPT 识图功能写的油猴脚本安装教程
[4] 盼了 300 天终于盼来的 @GPTs 群聊,和想象中 300 天后更精彩的世界
[5] 用 AI 打造有无穷变化的人生重开模拟器
[6] 一个一串一串串——比提问更重要的是追问
[7] 平生第一次写小说获奖,是AI帮我的!
[8] 人的用处——我在人机协作小说创作中找到的存在感

更多AI工具,参考Github-AiBard123国内AiBard123

可关注我们的公众号:每天AI新工具