什么是少样本提示(Few-Shot Prompting)?
少样本提示是在你提出真正请求之前,先在提示语中放入 2 至 5 个工作示例的做法。每个示例都包含一组输入,以及你希望得到的具体输出。模型会从这些示例推断出你的格式、语气与判断逻辑,再用相同模式处理你的真实请求。
零样本提示只给模型指令。少样本提示给模型指令再加上一份小型示范数据集,差异就藏在那份示范里。
由 Vellum 整理的《提示工程指南》指出,加上 2 至 5 个示例通常能使结构化输出的任务表现比零样本提升 15 至 35 个百分点,且大多数任务在五个示例之后曲线就会趋平。
为什么它的效果胜过写更好的指令?
指令告诉模型你要什么。示例则让模型看到成功的样貌。两者冲突时,示例几乎总是胜出。一条模糊但配上三个好示例的指令,在任何稍有结构复杂度的任务上,都会胜过一条 400 字、没有示例的指令。
原因是模型会把示例同时当成三件事的主要信号:输出格式、细节层级,以及隐含的边界判断。一条 400 字的指令试图描述这三项,反而会产生模糊地带。三个示例则同时解决这三项,没有任何模糊空间。
Microsoft 自家的 AI 文件说得很直接。当任务有清晰的输入输出形态、但难以用纯文字描述时,少样本提示就会发挥作用。分类、抽取、格式转换、特定格式的摘要,所有这类任务从示例得到的提升都高于从调整指令得到的提升。
什么时候该用少样本?什么时候该用零样本?
决策的核心是:你能否比写一条清楚的指令更快地写出一个清楚的示例。多数情况下,示例更快。
使用少样本的时机:
--- 输出有需要保留的特定结构(JSON 键、Markdown 表格、指定数量的条列)。
--- 任务涉及边界难以文字化、但容易示范的判断(情感分类、严重程度评级、语气比对)。
--- 你需要在多次输出之间保持一致的语感。
--- 任务具重复性,相同提示语将会以不同输入执行很多次。
使用零样本的时机:
--- 任务开放式,你刻意希望模型带来自己的结构。
--- 输出偏向对话而非结构化数据。
--- 你只有单一输入要处理,编辑结果比准备示例更快。
一个常见错误是把该用零样本的任务硬套上少样本。当你要模型发散思考或创造变化时,三个示例反而会让模型模仿示例,而非生出真正新的内容。
如何挑选有效的示例?
三项规则能把有效的示例与会让模型困惑的示例分开来。
规则一:覆盖边界案例,而非平均案例。若任务带有模糊边界,示例就应该坐落在那些边界上。三个全部看起来简单的示例,无法教会模型如何处理难的情况,真正的教学价值藏在临界判断里。
规则二:示例长度要接近真实任务。如果真实输入会是 200 字,示例就应该落在 150 至 250 字之间。三个两句话的示例后面接一段五段落的真实输入,会让模型截短真实答案以配合示例长度。
规则三:每一个示例都必须严格遵守格式。若输出应该是 JSON,每个示例都必须是有效 JSON;若应以「Summary:」开头,每个示例也必须以「Summary:」开头。模型把示例当成规则本身,示例之间的任何不一致都会造成输出漂移。
Anthropic 为 Claude 发布的提示工程指南再加上第四条实用规则。当示例彼此并非严格序列关系时,应明确标示。把每个示例放进独立区块,并冠上 Example 1、Example 2、Example 3 之类的标题。这能避免模型在输入相似时把多个示例混为一谈。
一条完整的少样本提示语长什么样?
最快让概念变具体的方法,就是看一条完整的可用提示语。下面这条对应一个常见的实务任务:把客户支援邮件分类到意图类别,并附上信心评分。它用三个示例分别覆盖了简单、棘手、模糊三种情境。
试试这条提示语:
你是客户支援邮件分类器。针对每封邮件,输出意图类别与一个从 1 至 5 的信心分数。仅可使用以下类别:BILLING、TECHNICAL、ACCOUNT、FEEDBACK、OTHER。
Example 1
Email:「你好,我十月的发票被扣款两次,订单号 884321,可以退还重复扣款吗?」
Output:BILLING, 5
Example 2
Email:「密码重设邮件收不到,垃圾邮件夹也查过,试了三次。」
Output:ACCOUNT, 4
Example 3
Email:「想说新介面很好看,不过数据超过 1000 列时汇出功能偶尔会崩溃。」
Output:FEEDBACK, 3
现在请分类这封邮件:
Email:[在这里贴上邮件]
Output:
让这条提示语生效的有三件事。指令短。示例分别涵盖了一个简单意图、一个中等、一个信号混合且信心应降的情况。输出格式在模型看到真实输入前,已经被 Example 1 完整示范。
加入示例实际会多花多少成本?
少样本提示语每次呼叫的成本确实会增加。问题只是这个额外成本是否值得换来准确度的提升。
一条包含三个 50 字示例的提示语,每次呼叫大约多 200 个 token。在 GPT-5.5 每百万输入 token 美金 5 元的价格下,每次呼叫多出大约美金 0.001。在 Claude Sonnet 4.6 每百万输入 token 美金 3 元的价格下,多出约美金 0.0006。差异真实,但数字很小。
结构化任务的准确度提升通常为 15 至 35 个百分点。Mem0 于 2026 年发布的提示语基准报告测得:客户支援分类任务从零样本切换到四样本后,格式错误下降 22%、分类错误下降 28%。
对于一次性提示语,这个成本分析不重要。但若这条提示语会在某个工作流程里跑一万次,输出不一致的代价将远高于额外 token 的成本。这正是生产级 AI 工作流程在结构化任务上几乎都采用少样本的原因。
今天就能升级你提示技巧的一个习惯是什么?
建立一份个人示例库。每次你写出一条能产生满意输出的提示语,就把那组「输入—输出」存进一份笔记档,并按任务类型分类。下次遇到类似任务时,从库里拉两三组贴进提示语当示例,你就能跳过多数人每次都要重新尝试的试错回合。
这一个习惯,把中阶 AI 使用者和那些每次第一次尝试就能得到生产级输出的人分了开来。示例本身才是真正的工作,指令只是包装。
少样本提示是提示技巧工具箱里杠杆最高的技术之一。它几乎不需要额外成本、不需要新工具、适用每个主流模型,并且稳定地改善真正重要的那类输出,也就是结构化、会成为更大工作流程一部分的输出。下次你的输出感觉不稳定时,先问自己一个问题。我是否把成功的样貌示范给模型看过?若没有,那就是该动手的地方。
懂AI的冷,更懂你的难 — UD 同行28年,让科技成为有温度的陪伴。
想知道你的 AI 技巧实际处于哪一级吗?
少样本提示只是其中一项技术。其他二十项中阶 AI 使用者常忽略的技巧,你是否也在运用?UD 的免费 AI IQ 测试,会把你的实际提示技巧和香港 AI 高阶使用者所掌握的技术做比对。我们手把手带你完成每一步,从测验分数,到那些能让你晋升下一级的具体习惯。