关于企业自动化,大部分人都搞错了
关于业务自动化,大部分香港老板都有一套固定的想法,但这套想法已经过时。剧本通常是这样:要自动化一个流程,就要有 API、要有程式员、要有六位数的预算起跳。所以当你每日要登入十次的供应商系统根本没有 API 时,唯一的选择好像就只剩下"再请多一个初级员工"。
这个剧本已经不再适用。2026 年 5 月,Microsoft 将 Computer Use AI 在 Copilot Studio 内推出至正式版本,这意味著 AI 代理现在可以像真人一样,点击、输入、操作任何软件,完全不需要 API。本文将解释什么是 Computer Use AI、它如何运作、能做什么、不能做什么,以及现在是否适合你的业务。
Computer Use AI 是什么?
Computer Use AI 是一类 AI 代理,它透过电脑的视觉介面操作软件,方式与真人员工完全一样。代理先用视觉模型"看"萤幕,再决定下一步要点击哪里或输入什么,然后透过键盘和滑鼠指令执行动作。整个过程不需要任何特殊整合、API key 或资料库权限。
Microsoft、Anthropic 和 OpenAI 都在 2025 年至 2026 年初推出了商用级的 Computer Use AI。根据 Microsoft Copilot Studio 2026 年 5 月发布的官方说明,Microsoft 于 2026 年 5 月 13 日将 Computer-Using Agent 在 Copilot Studio 推至正式版本,成为首间在生产规模上向所有商业 Power Platform 区域全面提供 Computer Use AI 的大型云端供应商。
Computer Use AI 如何运作?
Computer Use AI 在每次执行动作时,会重复以下三个步骤。视觉模型先撷取目前的萤幕画面。推理模型再决定下一个动作,例如"点击登入按钮"或"将发票编号输入第二个栏位"。执行层再实际移动游标、输入文字到对应应用程式中。
三个核心元件
视觉层负责理解画面内容,包括按钮、输入框、错误讯息及非结构化文字。规划层负责将高阶指令例如"提交这张发票"拆解为一连串的 UI 动作。执行层则实际移动游标、输入文字,并等待画面更新后再进行下一步。
根据 Microsoft 官方公布的资料,2026 年 5 月版本的 Computer-Using Agent 相比预览版减少了 50% 的 token 使用量,并将任务完成度提升 20%。这就是为什么香港企业现在才开始觉得用 AI 代替重复软件操作有经济效益。
Computer Use AI 实际能做什么?
Computer Use AI 适合处理有明确起点、可预测流程、明确终点的软件工作。目前一代的技术在网页应用程式、佈局稳定的桌面应用程式、以及员工每日重复处理多次的登入系统上效果最好。
常见适合处理的工作流程包括:
--- 登入供应商或政府网站,下载每日报表。
--- 将 PDF 内的发票输入到没有 API 的会计软件。
--- 监控共用信箱,打开每一封新邮件,分类请求,并在现有系统建立工单。
--- 比较三个供应商网站的报价,并将结果储存到试算表。
--- 每日三次检查旧式 POS 系统的库存,并将数字写入仪表板。
根据 Microsoft Copilot Studio 2026 年 5 月的发布说明,平台现在支援模型选择(简单步骤可用较快速的模型,复杂步骤可用较聪明的模型)、凭证保险库、以及对小幅介面变动的容错能力,例如按钮移位或新出现的提示视窗。
Computer Use AI 不擅长处理什么?
Computer Use AI 虽然强大,但并非万能。在签约前,香港老板应该先了解它在三类工作上的限制。
高度视觉化或非标准的介面
大量动画、自订影片播放器、拖放画布、或佈局不断变化的软件,会让代理找不到正确的按钮。大部分现代网页应用程式运作正常;某些客制化的工业软件就不行。
需要在模糊情况下做判断的工作
如果任务是"判断这位客户是否适合我们的服务",Computer Use AI 不会比一位受过训练的员工做得更好。它是用来执行决策的工具,不是用来做细腻判断的工具。
需要实际物理动作的工作
任何超出萤幕范围的事情,例如签署纸本文件、接听电话、或在仓库中移动物件,仍然超出它的能力范围。
香港中小企用 Computer Use AI 要多少钱?
Computer Use AI 的定价是按代理处理的讯息数量计费。Microsoft Copilot Studio 按 Copilot Studio 讯息计量收费,小型企业套餐每月由港币约 1,500 元起跳,并随用量扩展。一个每日处理 200 张发票的代理大约每月使用 6,000 条讯息。
与在香港聘请一位月薪约 12,000 港元的兼职资料输入员相比,处理相同工作量的 Computer Use AI 代理成本约为员工薪金的 20% 至 30%,且全天 24 小时运作,不需要放假。这个成本论述在每天于同一套软件上重复 50 次以上的流程上最为强烈。
Computer Use AI 与 RPA 有何不同?
机器人流程自动化(RPA)从 2010 年代开始存在,例如 UiPath、Automation Anywhere、Power Automate Desktop 等工具,它们会记录真人在萤幕上的操作,然后重播这些动作。RPA 与 Computer Use AI 的最大差别在于"推理能力"。
RPA 在介面有任何变动时就会失灵。如果按钮移动了五个像素,或者跳出新的提示视窗,脚本就会失败,需要有人重建。根据 Microsoft 2026 年 5 月正式版的说明,Computer Use AI 能应对这类变动,因为它和真人一样是"看著萤幕做事"。即使按钮移位、颜色微调、或位置改变,它仍能辨识"那个写著'提交'的蓝色按钮"。
这就是为什么分析师形容 2026 年是 RPA 被悄悄吸纳进"代理时代"的一年。RPA 在高流量、极稳定的流程上仍然有它的角色;Computer Use AI 处理的是现实业务自动化中那 80% 较杂乱的部分。
让 Computer Use AI 操作公司系统,安全吗?
安全是每位香港老板问的第一条问题,答案归结为三个控制点:凭证、沙箱、人工检查点。现代 Computer Use AI 平台会将登入凭证储存于保险库中,代理本身永远看不到密码。代理会在虚拟机或浏览器沙箱内运行,无法触及指定工作流程以外的任何东西。并且平台支援"人在迴路中"的检查点,代理可在执行关键步骤前暂停,等待真人批核。
例如在 Microsoft Copilot Studio 2026 年 5 月的版本中,代理可被设定为将异常情况及低信心案例升级至真人审核,再执行任何动作。Microsoft 公布的 Graebel 案例展示了这种模式的实际应用,代理从头到尾处理服务订单,但遇到边界情况时会暂停等待人工批核。
关于 Computer Use AI 的常见误解
误解一:它会取代 IT 人员。事实刚好相反。Computer Use AI 将 IT 工作从手动处理工单,转移到设计与监督代理。你的 IT 团队或服务供应商仍需要设定代理、监控准确度、并在业务规则改变时作出调整。
误解二:它只适合大企业。因为 Computer Use AI 不需要 API 整合项目,每个工作流程的部署时间已从数月缩短到数天。这是第一代让 20 人的香港公司可以部署与跨国银行同等技术的自动化方案。
误解三:AI 会失控做出破坏性的事。Computer Use AI 代理运行于沙箱中,配备凭证保险库与人工审批关卡。它的风险轮廓比较接近"拿著清单的初级员工",而不是"失控的机械人"。
实际应用 Computer Use AI 的步骤
评估 Computer Use AI 是否适合你的业务,最快的方法是挑一个每天至少浪费员工一小时的流程,先建立一个代理处理该特定流程,再考虑扩展。
第一步:选对第一个流程。挑选重复性高、软件操作为主、流量大的工作。发票输入、每日报表下载、供应商网站比价、信箱分类,都是好的入手点。
第二步:记录真人的操作步骤。让员工花两个星期写下每一个点击、每一个栏位、每一个判断。这就是代理的设计蓝图。
第三步:在沙箱中建立代理。先在测试环境用非生产帐号设定代理。让代理与真人并行运行一週,比较准确度。
第四步:在关键点加入人工检查。找出"一旦做错会造成实际损失"的步骤,例如批准付款,在这些位置加入人工审批关卡。
第五步:量度成效并扩展。追踪节省时间、错误率、每件任务成本。第一个流程稳定后,第二个通常会轻鬆很多。
常见问题
问:是否一定要用 Microsoft 才能用 Computer Use AI?
不需要。Microsoft Copilot Studio 是其中一个选项,并于 2026 年 5 月 13 日推至正式版本。Anthropic Claude 与 OpenAI 也提供 Computer Use AI 功能。你现有的软件堆叠不必是 Microsoft。
问:部署第一个代理通常要多久?
对于范围清晰、软件稳定的工作流程,有经验的团队通常可以在两至四週内交付可运作的试点。涉及大量边界情况的多步骤複杂流程可能需要更长时间。
问:如果我自动化的网站改了介面设计怎么办?
现代 Computer Use AI 代理本身就是为了应对小幅 UI 变动而设计,因为它是"看著萤幕做判断"而非"跟著固定脚本走"。大型介面重新设计可能仍需要重新训练或重新配置代理。
问:Computer Use AI 能处理中文介面的软件吗?
可以。Microsoft 与 Anthropic 採用的领先视觉模型,都具备强大的多语言支援,包括繁体中文与简体中文。
问:资料会不会被传出香港?
视乎供应商与区域设定。大部分企业级平台现已提供区域资料驻留选项,包括亚太地区。在处理敏感客户资料前,请先确认该平台的资料驻留政策。
对香港中小企的总结
Computer Use AI 改变了企业自动化的经济学。过去十年,"值得自动化"与"不值得自动化"的分界线,画在"有 API、有六位数预算"这条线上。2026 年 5 月起,这条线已大幅移动,任何你的员工每日在软件上重复 50 次以上的流程,现在都应被列为候选对象。
这不代表每间公司都要在本季部署十个代理。意思是该问的问题已经改变,从"我们是否负担得起自动化这个流程?"变成"哪一个流程被自动化之后带来最大回报?"在同行中第一个答对这条问题的公司,往后两年将会把节省下来的时间与成本,複利投入到更好的服务与更高的利润。
懂AI的冷,更懂你的难。UD 同行28年,让科技成为有温度的陪伴。
准备好找出你的第一个 Computer Use AI 工作流程?
Computer Use AI 在概念上听起来很强大,但价值要在实际解决你业务问题时才会浮现。UD 为香港企业部署企业级自动化已有 28 年经验,我们手把手教你由零开始:从找出第一个合适的流程,到完成试点上线,每一步都按你的预算与团队节奏走。