Claude 有一个大多数用户从未发现的功能,它从根本上改变了 AI Agent 的运作方式。这个功能叫做 Dreaming,Anthropic 在 2026 年 4 月 21 日推出研究预览版,同时推出的还有多代理协调(multiagent orchestration)。当大部分 AI 圈在热议新模型的基准测试时,这个功能悄悄上线了:它让你的 Claude Agent 可以回顾自己过去的工作记录,找出哪些方法有效、哪些方法失败,然后在你休息时自动更新记忆。
如果你曾经对 AI 助手重复犯同样错误感到沮丧,这就是答案。一旦你理解这个功能,你就会用截然不同的方式去思考 AI Agent 的价值。
什么是 Claude 的 Dreaming 功能?
Dreaming 是 Claude Managed Agents 中的一个排程过程,它会回顾过去的 Agent 工作记录与记忆储存,提取模式,然后自动整理记忆更新。它在背景运作,发现重复出现的错误、Agent 趋同的工作流程,以及团队成员共有的偏好。你可以决定更新是自动套用,还是需要人工审核后才生效。
最容易理解的比喻是:把 Dreaming 想成 Agent 版本的「人类睡眠记忆整合」。白天,你的 Agent 处理工作并累积上下文。在 Dreaming 过程中,它回顾这些上下文,识别哪些值得保留,然后重写自己的记忆,让下次工作更精准。没有 Dreaming,每次 Agent 对话都从同一个起点开始;有了 Dreaming,你的 Agent 会在数周使用后明显变得更聪明,因为它记住了哪些方法有效。
这个功能目前处于研究预览阶段,支持 claude-opus-4-7 与 claude-sonnet-4-6,使用时需要在标准 managed-agents beta 标头之上,再加上 dreaming-2026-04-21 beta 标头。
为什么 AI 实战者应该关注这个功能
如果你用 AI 建立工作流程,你大概碰过这种墙:今天的提示效果很好,但明天你又要提醒模型同样的五个偏好、同样的品牌指引、同样的特殊情况。Claude Projects 与 ChatGPT Memory 之类的记忆功能确实有帮助,但它们只储存你明确告诉它的事实。Dreaming 不同,它从你实际的操作中推断模式,而不是从你写下的规则中学习。
实际影响体现在三个层面。第一,你的 Agent 停止犯同样的低级错误(格式错误、忘记限制条件、重复问同样的澄清问题)。第二,Agent 自动学会你的风格,不需要你写长篇大论的系统提示。第三,在团队环境中,共享偏好会有机浮现:如果内容团队所有人都拒绝被动语态,Agent 从拒绝记录中学到这点,而不是从你必须写下的规则。
对于在香港经营行销、营运或研究工作流程的实战者来说,这就是「AI 助手」与「开始理解团队的 AI 同事」之间的差别。
Dreaming 的运作原理
Dreaming 基于三个输入运作:完成的 Agent 工作记录、Agent 目前的记忆储存,以及一份结果评分准则(outcomes rubric),告诉 Claude 什么是「成功的」工作。在你设定的排程上(通常是每晚),Claude 会读过最近的工作记录,对照评分准则进行比较,然后提出记忆编辑建议:新增哪些条目、移除哪些过时条目、修改哪些现有条目。
结果评分准则是大多数人忽略的关键。没有它,Dreaming 对哪些工作算成功没有判断依据,自然无法分辨哪些模式应该被强化。好的评分准则必须具体:「任务完成时没有追问」是清晰的讯号,「用户看起来很满意」则不是。
以下是一个你可以直接套用的最小评分准则结构,存成 YAML 档放进你的 managed-agent 设定中:
试试这份结果评分准则:
outcomes:
- name: task_completed_first_pass
description: Agent 在用户不需要重新解释或修正方向的情况下完成任务
signal: high
- name: format_matched_request
description: 输出格式符合用户要求(没有要求重新排版)
signal: high
- name: user_accepted_output
description: 用户没有要求大幅修改
signal: medium
- name: avoided_known_mistake
description: Agent 没有重复记忆中标记的错误
signal: high
dreaming:
schedule: "0 2 * * *" # 每天凌晨 2 点
review_window_days: 7
auto_apply: false # 等到你信任这些模式后再设为 true
当 auto_apply: false 时,Claude 会产生一份提议的记忆变更差异报告(diff),你透过 Claude Platform 控制台审核。经过两到三周的审核,大部分团队会把它切换成 true,让 Dreaming 无人值守地运作。
多代理协调:故事的另一半
Anthropic 与 Dreaming 同时推出了公开测试版的多代理协调,两者搭配效果更好。协调功能让主导 Agent 把复杂工作拆解成多个部分,再分派给各个专家 Agent,每个专家有自己的模型、提示与工具存取权限。专家们在共享文件系统上并行作业,再向主导 Agent 回报结果。
这在实战中的价值:以前一个 Agent 要负责研究、起草、事实核查、格式整理的内容工作流程,现在可以拆成几个并行运作的专家。研究专家用 Sonnet 4.6 配网络搜索。起草专家用 Opus 4.7 不配工具。事实核查专家用 Sonnet 4.6 配不同的搜索工具与更严格的提示。主导 Agent 组合最终输出。
当你把这个功能与 Dreaming 配对使用,每个专家都会随时间学会自己的工作。事实核查专家在事实核查上越来越强。起草专家学会你的风格。你不再是调教一个巨大的提示,而是培养一个小型 Agent 团队,每个 Agent 都在一件事情上越来越精准。
设定步骤:本周试用 Dreaming 的三个步骤
你不需要彻底改造工作流程才能测试 Dreaming。挑一个每周至少做三次的重复性任务,为它设定一个 managed agent,让 Dreaming 在这个单一工作流程上运作两周,然后比较品质。
第一步:选对任务。最适合的候选任务具备清晰的成功标准与频繁的重复性。例如:每周竞争分析报告、每日社交媒体草稿、客户支持回复分流、特定 repo 的代码审查。避免成功标准主观的一次性创意任务。
第二步:建立一个有明确记忆的 managed agent。在 Claude Platform 控制台建立 managed agent,给它一个清晰的系统提示,定义它可以使用的工具,并启用记忆。用上面的 YAML 模板设定结果评分准则。第一周设 auto_apply: false。
第三步:每周审核 dream 差异报告。每周一早上检查提议的记忆变更。你会看到类似「用户在行动项目上偏好项目符号而非编号清单」或「行销文案中避免使用『leverage』一词」的条目。批准符合团队实际偏好的,拒绝错误推断的。两周后,你的 Agent 会明显感觉更符合团队的工作方式。
Dreaming 目前的限制
Dreaming 处于研究预览阶段,功能可用但有几个你需要事先规划的粗糙边缘。最大的限制是:它目前只能在 Claude Platform API 上的 managed agents 运作,无法在 claude.ai 对话界面或 Claude Projects 中使用。如果你的团队透过消费者 App 使用 Claude,你目前无法享受 Dreaming 的好处,你需要在开发者平台上建立 Agent。
第二个限制:dream 产生的记忆更新品质高度依赖对话量。每周少于约 20 次对话,Dreaming 没有足够讯号找出有意义的模式。它仍会提议更新,但大部分会是杂讯。如果你的使用情境是低频率的,等累积几周对话量后再开启 Dreaming。
第三个限制:Dreaming 偶尔会过度泛化:一次性的用户偏好(你那个周五的社交贴文想要轻松语气)可能被当成一般规则写入。这就是为什么前两周的人工审核不可或缺。当你拒绝几个过度泛化的更新后,系统会学会更保守。
一个真正受惠于 Dreaming 的工作流程
想像一间香港行销公司,每天为 12 个客户品牌做社交媒体草稿。以前每次草稿对话都需要载入品牌简介、语气指引、过往范例。即使用 Claude Projects 存放品牌资产,Agent 仍会预设用通用的措辞,需要不断修正。
使用 managed agent 加 Dreaming 运作三周后,系统开始捕捉团队从未明确写下的模式:这个品牌从不用感叹号,那个品牌偏好标题用问句,X 品牌的创办人不喜欢「innovative」这个字。这些都不在任何简介里,全部从过往对话的拒绝模式中浮现。每篇贴文的起草时间下降约 30%,不需修改即被接受的草稿比例从约 40% 升至 70%。
第一周你不会看到这些数字,第四周才会看到,那时 Agent 已经梦过足够多的循环,学会了你的团队。
更大的视角
今天大部分 AI 工具是无状态的。你设定它、使用它,明天从同一个地方重新开始。Dreaming 是第一个广泛可用、以结构化方式打破这个模式的功能。它不是自我改进 AI 的最终形态,但是实战者真正可以部署到生产环境的第一步。
如果你把 AI 当作工具,Dreaming 听起来像一个优化。如果你把 AI 当作同事,Dreaming 就是「永远不会成长的实习生」与「逐渐胜任角色的初级同事」之间的差别。最先搞懂这点的团队,半年后会拥有感觉像团队一份子的 Agent,而其他人还在每个周一重新解释上下文。
懂AI,更懂你 UD相伴,AI不冷。
立即试用
挑出你本周最重复的 AI 任务,为它设定一个 managed agent,并用 auto_apply: false 开启 Dreaming。审核第一周提议的记忆更新。你会看到自己从未明确写下的工作模式浮现出来,那一刻你就会真正理解 Dreaming 的价值。
建立自我进化的 AI Agent 不再是研究项目,而是你这一季就能部署的工作流程。难点在于选对任务、写出对的结果评分准则、审核对的差异报告。UD 团队手把手带你完成每一步,从挑选你第一个启用 Dreaming 的工作流程,到扩展到整个团队。