盼了300天终于盼来的@GPTs群聊,和想象中300天后更精彩的世界
作者: 南瓜博士 来源: 南瓜博士
虽然还没有被灰度到 @ 功能,也必须写点什么。从去年两月建硕提出一个机器人和机器人对话的世界[1]开始,我就一直在畅想,也做过很多实验局部效果的尝试。
原本以为这个世界还很遥远,但终于看到 OpenAI 开始有行动(之前的 plugin 和 GPTStore 真很令我失望),也恰巧看到了一篇论文提到 Agent Transformer,给畅想中会遇到的难题带来了希望。
所以,赶紧来和大家聊聊,分享一些 @GPTs 的花式玩法、说说目前还存在的难题、对不远的将来可能实现的功能做些畅想、以及分享我作为业余玩家现在可以进行的准备。
1
@ 群聊功能不新鲜呢
周六早晨听说 GPT 出了 metion 功能,不由感叹——这个百姓 AI 早就部分实现的功能,终于等来了官方版。
300 天前智能号[2]就实现了 & “按一下”的语法。微信群里有一个机器人,和它对话时只要 & 了特定 bot,就会转给被 & 的 bot 来回复消息。靠着这个功能,去年 3 月 16 日文心一言发布后一小时内,所有在百姓 AI 相关微信群的伙伴们就都能通过 &文心一言 尝鲜了[3]。下图是微信群聊里所以还多了 @主机器人,如果是单聊就只需要 &。
&好画 就有会画画的 bot 帮你画图,&小九 则由爱写散文的 文青小九 bot 返回你一段散文。不足之处是 & 不能带历史记录。原因也很简单——当时支持的 token 数还很有限、token 用多了也很贵。
因为当时国内大模型能力实在够呛,微信也经常会封号,就没有多做宣传。我刚问前同事大雄,& 功能早已下线,或许近期会恢复。
2
@GPTs 的玩法很多
两个多月前 OpenAI 刚推出 GPTs 时,我就提出希望 GPTStore 不是 AppStore 式的列表,而是能出现在对话中[4]。这次 OpenAI 发布 @ 功能,让各 GPTs 可以在同一个对话中共享上下文,算是部分满足了我的心愿,玩法已经非常多了。
例如通过群聊共创(可怜的我,还没有被灰度到,只能画个示意图)
之前一堆 AI 角色开公司,都可以用 @ 来搞定。我曾经让杜拉斯、萨冈等人一起合作写小说[5],当时 AI 角色的行为靠的是大模型对这些作家本身的认知。有了 @ 功能,就可以在 GPTs 里精细设计它们的表现了。
GPT 还有一个超有用的功能,我的朋友天哥两个月前就被灰度到了,不知道为何至今我也没听其他人说起过。在页面中选中内容,会出现“引用”按钮。点击后选中内容就以引文的形式出现在对话框内,从而能很方便地强调上下文中的局部。
@ 和 引用功能结合起来能串成非常强大的工作流,且人类随时都能插入干预,会比多数 agent framework 更灵活。但就算没被灰度到这些功能,也可以靠我的 EasyFill 脚本工具[6]来达成近似的效果。
上图每一个菜单项都可以看成是一个 GPTs。唯一的区别是 EasyFill 里只能设置纯 prompt,没有知识库文档也没有 actions。所以,还是特别期待自己能早日用上 @ 呀。
我已经迫不及待想要这样玩儿了——
只要设置好各角色的 GPTs,就能直接出剧本(在这些角色的 prompt 中要求看到 : 就开始演戏):
和 AI 一起玩游戏,扮演上帝的同时,还能客串别的角色给它们捣捣乱(这些玩家需要通过 action 知道自己的身份以及做决策):
之前我的“人生重开模拟器”[7]被财猫同学发扬光大,AIGoodGames repo [8]里有不少有意思的游戏,都可以用 @GPTs 的方法迭代一遍。
3
更多未来玩法的畅想
但这些还远不是机器人和机器人对话世界的全部。
量子位文章《一个 @ 让三百万 GPTs 为你打工》[9] 下最高赞评论是“我需要一个 AI HR 来应对 300 万员工的筛选。”确实呢,我期待的最重要的功能,就是根据对话上下文给出使用 GPTs 包括使用方法的推荐。这将是各种复杂玩法的基础。
EasyFill 里也有将内容转成链接的玩法,算是这个功能的平替实现。
如果是了解我喜好的私人陪伴 AI,可以按需直接 @ 了就自动执行,就更方便了。本例子来自建硕的文章[1]:
更进一步的,有些机器人之间的对话我都无需了解。例如下图 @华住管家 没准还找了他们的促销活动专员,那对我是透明的。
这些畅想其实都没什么大不了——早在去年四月 OpenAI 推出 plugin 时大家就有在讨论。只是当时的 plugin 很不好用,两个主要原因:一是身份认证等有很多麻烦;二是同一个对话内只能提前指定最多三个 plugin,多了 token 数支持不了。所以,畅想就停留在畅想,或者只是使用场景特别局限的小工具。
我原本也觉得这些麻烦恐怕很难解决。可是前不久有流传 Altman 说“最正确的做法是设想一个上帝般的模型正在运作,然后基于这种设想来构建最好的产品”,我看到这句话的第一反应就是:GPTs 的路由能靠大模型搞定了?
4
Agent Transformer 或许让畅想接近可能
前不久看了篇 agent 的综述[10],里面提到的 agent transformer 引发了我无限想象。
我和朋友曾聊过 agent 之间哪天不再使用语言、而是靠向量来交流,没想到这么快就来了。用 agent token,免去将给 agent 的指令翻译成语言指令再翻译回来的方案,一是大幅提升效率,二是能避免很多语言不精准的麻烦。
这,才是正道呀!
整整一年前,我和我先生讨论 bots 的路由:如何识别用户的意图、然后将任务转发给对应的 bot 来完成。出于效率考虑(一年前调用 openai 的 API 太贵太慢),我想的是传统分类器。我先生说从落地来看这当然可以,但是新技术已经显示那么强的潜力了,再用老方法总不太对劲。
当时我虽然认可他说的,但并没觉得老方法是多大的问题:毕竟,做个分类器从几百个穿衣助手或天气预报之类的 bots 中选一个,有什么难的呢。但几个月后,我遭遇了 plugin 的局限。再过几个月,我开始给自己写私人陪伴者 SPal ,更是清晰地体会到——必须等待新技术的成熟。传统的分类器,真没法应对 300 万 AI 员工。
举个例子:
GPT 早就可以借助 Wolfram|Alpha 获得计算知识的超能力,但最新版 Wolfram 语言都已经有 6000 个函数了,GPT 怎么知道该调用哪个函数、又该用什么样的格式给出参数呢?总不能把这些都塞在 GPT 的 actions 里吧。
GPT 就只能猜,错了就自我纠正。在我去年四月对 Wolfram Plugin 的实验中[10]看到它来来回回十多轮才终于搞定调用。
这样的效率,如果用在指挥炒菜机器人的手指动作上,不知道要砸碎多少个盘子、烧焦多少食物了。
所以,我去年起初还对各 agent framework 非常感兴趣,但渐渐的就认定这光靠代码是无法搞定的。现在看起来,agent transformer 也许是答案。训练出 agent actions 的模型,让 GPTs 之间直接用 token 来对话,效率和精确度都会高很多吧。
5
普通人此刻能做什么
如果我们应该期待一个上帝般的模型正在运作,那接下来 6~18 个月,像我这样读论文都磕磕绊绊的业余玩家,该做什么呢?
我的观点是——通过实践去体会一个 GPT 要完美工作到底需要多少背景信息,去想象 GPTs 之间的交互有多少本质的信息被传递。然后,根据实践得来的体感,设计非常非常多的极细粒度的 GPTs,以及 GPTs 的混用流程。现阶段混用可能需要一些不太方便的手工操作(可以写插件脚本来改进),但相信等 AI 能力上来后 (token 长度继续大幅提升,agent transformer 搞定 agent 指令的传递,还有记忆等),就可以顺畅使用了。
我从去年 11 月开始,关注点落在好奇心上。我探索了很多 AI 守护和激发好奇心的用法,期待在 300 天后,这些用法对应的 GPTs 能被组装成人机协同进行终身学习的好奇陪伴者。毕竟,用 AI 降本增效一小时的工作十分钟就完成后,剩下的五十分钟,我们应该探索更多有趣的事[11]。
如果你也对 AI for 好奇心好奇,欢迎多交流。
特别感谢
感谢天哥两天前不厌其烦为我实验 @GPTs 的能力。这是他的两个 GPTs,有很多个人日常工作的 know-how 在内,非常推荐使用。
用来解决创新问题的天思引 https://chat.openai.com/g/g-1guXfilbi-tian-si-yin
提炼文章核心词汇做总结的天词练 https://chat.openai.com/share/f5bb2c18-604e-40b4-81a8-577a5019a074
相关阅读
[2] 智能号 —— ChatGPT 时代的域名系统 by 王建硕
[3] 通过 & 功能体验文心一言
[8] https://github.com/EmbraceAGI/AIGoodGames
[10] https://arxiv.org/abs/2401.03568 一篇关于 Agent AI 的综述
[11] 在提效之外,更要追求有趣
希望今天的文章能对你有启发。关注加星点赞点在看,我们一起打造 300 天后的精彩世界吧。
更多AI工具,参考Github-AiBard123,国内AiBard123