一个一串一串串——比提问更重要的是追问
作者: 南瓜博士 来源: 南瓜博士
2 月:媒体报道新兴职业 Prompt Engineer 年薪可达 200 万
3 月:Sam Altman 说五年内我们将不再需要提示词工程师
6 月:哈佛商业评论发文 AI Prompt Engineering Isn’t the Future
9 月:FlowGPT 开启第三季 Prompt 大赛并再次传播了他们 5 月的文章“为什么我们坚信Prompt是未来”
对于这些消息和观点,你怎么看?
很多新近加我的朋友给我打上了 prompt engineer 的标签。其实除了偶尔做着玩儿的实验,日常 70% 以上和 AI 的对话,我都是随心所欲想啥就问啥。并且,我认为对于绝大多数人来说,对 prompt 技巧的关注,不应该大于对话内容本身。
我并非在说 prompt 技巧没价值。恰恰相反,我对人人可用的自然语言编程有极浓厚的兴趣。但和 AI 对话时是否需要 prompt 技巧,应该区分不同的场景来判断。人们对 prompt engineering 价值有不同判断,其实是因为大家说的 prompt 其实并不是一回事。
我把使用 prompt 的场景分为三种:一个,一串,一串串。
“一个” 就是我们最为熟悉的单条 prompt。
除去催眠、越狱以及一些传说中的魔法咒语,单一 prompt 最重要的技巧就是结构化。有很多结构框架,比如 mattnigh 的 CRISPE,国内财猫的 BROKE,Arthur 的多角度定义角色等等……
这些结构作为脚手架能很好地帮使用者思考如何描述需求,由此写出来的 prompt 确实也能保证 AI 回复质量的下限。
但,只是保证下限。
真正能提升 AI 回复质量上限的,是结构化框架里具体的内容,也就是最近我一直在说的 know how。这倒是有很多值得精细打磨的地方。但其实和 prompt 技巧关系并不大,更重要的是看你是否具备相关的知识。将隐性知识说清楚道明白、可视地教给 AI,是最难也最有价值的部分。
**“一串”**更多地用于开发成完整产品,将 AI 功能嵌套在软件的代码中。
吴恩达的课程中就有一个最经典不过的例子:先用一个 prompt 识别用户说话的意图,例如咨询商品就从商品数据库里找出相应的内容,再用一个 prompt 基于找到的内容生成回复,最后一个 prompt 对回复完成评估,然后才能把回复发给用户。意图识别——>内容生成——>正确性评估,三个不同的 prompt,各自完成一个步骤,串起来成为一个完整的功能。
因为要嵌套到产品里,对 prompt 稳定性的要求就特别高,最需要技巧的 prompt 就是这一类。但是记得三月份时我们有很多讨论是“如何能让 GPT 用指定的 json 格式输出不要唠叨废话也不要瞎编一些不合理的值”,这个问题在 OpenAI 接口支持 function call 后就得到大幅改善。所以我猜,Altman 说的五年内不再需要提示词工程师也是指这类。
**“一串串”**则是我们普通人的日常使用。
开始一段对话、随性聊;有不同主题了,就再开一个新的对话页面。就这样一串一串的,文无定法。
不像单个的 prompt。除非是不断会被用到的重复性任务,希望能效率极高一次回车就搞定,否则不值得把任务专门优化成一句咒语。程序员写代码要避免 over design,写 prompt 也是同理。用最基础的结构化快速问一句,然后想到什么加什么,不断补充,多次来回也能获取高质量回复。
不像一串的 prompts。因为是自己用,不用担心输出结果是否能被代码接受,也就不需要强调稳定性。如果结果不合意,换个方法重问一遍呗。
也就是说,写“一个”和“一串” prompt 时需要的技能,在“一串串”的日常对话中并不重要,会追问就足够。
那,为啥我还要分析 Mr. Ranedeer 的 prompt、还要用伪代码写人生重开模拟器呢?
因为好玩呀。帕格尼尼用一根琴弦来拉小提琴,我就非试着用一个 prompt 来完成全部事,这样的炫技多好玩。
只是,千万别以为,这就是我们使用 AI 的全部。
===
P.S. 财猫同学看我上篇文章后,用好几天时间精心打磨了一个人生重开模拟器,有很多设计巧思在。欢迎有 code interpreter 的同学去 github 复制了 prompt 开玩, 也鼓励大家仔细研究,也来炫技,发布你的人生重开模拟器。(https://github.com/hamutama/LifeReloaded/tree/main 点击查看原文即可访问)
更多AI工具,参考Github-AiBard123,国内AiBard123