为什么 AI 绘图工具总是改掉角色的脸
AI 绘图工具一直不擅长在多张图中维持同一个角色。你好不容易做出完美的代言人形象,叫它再生成第二张,脸就变了、发线移了、衣服颜色也不同。这是市场推广人员放弃 AI 绘图的最大原因。好消息是:只要设定正确,现在这问题已经可以解决。
根本原因在于大多数模型把每个提示都当成全新创作,它对五分钟前生成的那个人毫无记忆。
角色一致性指的是同一个身分(脸孔、身形比例、标志性服装)能在不同场景、姿势与光线下稳定出现。没有它,你就无法做品牌吉祥物、漫画、产品示范或多页宣传系列。
Nano Banana Pro 是什么?它在一致性上有何突破
Nano Banana Pro 是 Google 建基于 Gemini 3 Pro 的图像模型,专为生成与编辑而设,并具备强大的身分保留能力。根据 Google DeepMind 的官方公布,它能在单一提示中,使用多达 14 张参考图维持最多 5 个人的样貌。这正是让角色工作真正可行的关键能力。
它与旧工具的差别在于推理能力。由于它建基于 Gemini 3 Pro,它能理解「保留同一个人,只更换背景」这类指令,而不是从零重画。
对实战使用者而言,这把工作流程从不断碰运气,转变为指挥一个会乖乖留在原位的对象。
如何锁定角色身分,让它在每张图一致?
要锁定身分,先上传一张清晰的角色参考图,并明确指示模型把它当作唯一的标准来源。在每次后续提示中加入锚定句,例如「以这张图作为角色参考」与「保留相同的五官与身形比例」。参考图的份量远高于单纯的文字描述。
先生成或挑选一张强而有力的肖像。正面、光线充足、表情中性的照片最适合作为你的主参考图。
此后每次新请求都附上同一张图。不要用文字描述脸孔再期望它对得上,让图片去做这件事。
若你需要多个角度,可先生成一张小型「角色设定表」(正面、侧面、四分之三侧面),在较难的场景中一并喂给模型。
怎样的提示结构能保持脸孔一致?
一条维持角色一致的提示有四个部分,并依此顺序:身分锚点、主体与动作、构图,以及一致性锁定。身分锚点指向参考图,锁定句则明确禁止改动脸孔。维持这个顺序,能避免模型在你描述新场景时自行造出另一个人。
以下是一条完整提示,你可以直接复制、附上参考图再调整:
以附上的图片作为参考角色。完全保留她的五官、肤色、发型与身形比例。把同一个角色放进一间明亮的香港咖啡店,坐在窗边桌前使用手提电脑,温暖的午后阳光,自然纪实的编辑摄影风格,16:9。不要改动她的脸孔或身分,只更换场景与姿势。
留意这个结构:第一句锁定身分,中段建立新场景,最后一句重复锁定。重复的指令很重要,模型对提示的开头与结尾赋予最高权重。
如何只换场景,而不重画角色?
用渐进式编辑,而非整张重新生成。保留现有图片,再下达针对性的编辑指令,例如「把背景换成森林」或「把外套改成深蓝色」,同时指示模型不要更动主体。这比为每个变化重写全新提示,更能保留身分。
心态上要把它当成在修一张相,而不是重画一张。你每次只微调一个变数。
这正是制作宣传系列的方法:一个主角色,再做十次编辑对应十个版位。脸孔保持一致,因为你从未要求一张新的脸。
做产品示范时,先生成一次主视觉,再在整个系列中逐一编辑手持产品、角度与背景。
哪些错误会破坏角色一致性?
最常见的错误,是在一条提示中堆叠互相冲突的风格指示。要求「动漫加超写实加水彩」会逼模型妥协,身分随之飘移。每张图只用一至两个风格锚点,整个系列中途也不要改风格。
第二个错误,是用大量文字细描脸孔,而非依赖参考图。冗长的脸部描述会与参考图打架,产出一个混合出来的陌生人。
第三个错误,是每个新场景都从零重生成。每次全新生成都是一次重新碰运气,应改用编辑。
第四个错误,是参考图品质太低。模糊或阴影过重的主图让模型缺乏可锚定的依据,输入品质低,输出品质自然低。
立即试做:建立一组三张的角色图
用接下来的二十分钟亲手验证。先生成一张干净的肖像并储存,再用上面那条可复制提示,把同一个人放进三个不同场景,每次只编辑场景。
你会看到同一张脸在三张图中稳定维持。这个结果,正是「把玩 AI 图像的人」与「能用它交出完整宣传系列的人」之间的分别。
这正是 UD 的信念核心:科技应该减少阻力,而非增添麻烦。懂AI,更懂你 UD相伴,AI不冷。
测试你的 AI 实力
既然你已能维持角色一致,下一步就是把它编进一套可重复的内容工作流程。我们会手把手带你完成每一步,从工具挑选、提示范本,到一条团队不必靠猜也能运作的生产线。
想知道你的 AI 技巧实际排在哪个级别?来做 UD 的 AI IQ 测试,看看你已掌握哪些技巧,以及下一步该补强哪些。