OpenAI 2026 年的研究終於公開承認了企業團隊已默默追蹤兩年的事實:AI 幻覺不是即將被工程消除的缺陷,而是大型語言模型訓練方式中的結構性特徵。即使是最強的前沿模型,仍會以全然信心輸出錯誤資訊,比率高得不適合在沒有額外控制的情況下用於高風險流程。對受監管行業的企業而言,這把幻覺從一個小問題提升為書面董事會風險。
AI 幻覺究竟是甚麼?
AI 幻覺是指大型語言模型生成流暢、自信、看似合理但實際錯誤的輸出。模型並非在工程意義上撒謊或故障,它只是根據訓練數據生成統計上最可能的下一段文字,這偶爾會與事實偏離。最危險之處在於,模型答對與答錯時的語氣完全相同。
這件事為何重要?因為 2026 年企業 AI 部署中最常見的失敗模式並非模型拒絕回答,而是模型不該回答時依然滿懷信心地回答。一家香港律師事務所在 2025 年底測試現成模型處理案例引用任務,發現 31% 引用是虛構的,案件名稱與日期看起來真實。模型沒有壞,它只是在做被訓練去做的事。
為何最先進的 AI 模型仍會產生幻覺?
幻覺持續存在,是因為語言模型被訓練去預測下一個合理的詞元,而非驗證真相。即使是 OpenAI、Anthropic、Google 的 2026 前沿模型,幻覺率仍可量度,因為訓練目標獎勵流暢與合理,而非事實準確。要降低幻覺,需要架構性改變,而非單純把模型做大。
根據 OpenAI 2025 年 9 月發布的研究論文《Why Language Models Hallucinate》,問題追溯到模型訓練時的評估方式。基準評分獎勵總是給出答案的模型,懲罰在不確定時拒答的模型。這等同於用「答錯與答不知道罰分相同」的方式訓練學生。可以預見,模型學會在不確定時流暢地猜測,而不是棄答。
史丹福 HAI 2026 年 AI Index 報告指出,事實問答基準上的幻覺率較 2024 年顯著改善,但通用前沿模型在沒有接地時仍維持在 8% 至 15% 之間。對每月處理 10,000 個 AI 輔助查詢的企業而言,這意味著如果沒有任何應對措施,將有 800 至 1,500 個自信卻錯誤的輸出進入流程。
企業領袖應關注哪幾類 AI 幻覺?
企業幻覺風險可分為四類,每一類需要不同的控制。四類分別是:虛構引用與來源、合理但虛構的數字、混淆事實(把兩件真實事物合併成一件錯誤事物),以及在大致正確的回應中對細節邊緣案例的錯誤自信。通用型應對方案忽略這些差異,必然失敗。
虛構引用是最高曝光度的失敗模式。2023 年美國聯邦法院曾制裁兩名紐約律師,因為他們提交的訴狀含六個虛構案例引用,類似事件在 2026 年仍持續發生。案件名稱聽起來真實、日期合理,但引用完全虛構。
合理但虛構的數字在金融服務業最為危險。模型被問及恆生指數歷史表現時,可能會自信地給出一個與真實接近但不完全準確的百分比。接近卻錯誤的數字,比明顯虛構的更難被察覺。
混淆事實發生在模型把兩個真實事件或實體合併為一個錯誤主張。例如把麥肯錫某報告中的引述歸於另一位麥肯錫作者,兩者皆真實,但歸屬錯誤。
細節邊緣案例的錯誤自信,往往出現在大致正確的回應中。AI 生成的前三個要點準確,第四個較專業的要點是虛構。讀者因為開頭正確而被催眠,全盤接受整段回應。
RAG(檢索增強生成)如何降低幻覺?
檢索增強生成(RAG)透過在查詢時向模型提供經驗證的來源文件,而非單靠訓練記憶,從而降低幻覺。模型不再是「憑記憶回答退款政策是甚麼」,而是從你的實際退款政策文件中讀取內容並基於它回答。因為模型被接地於來源文本,幻覺率大幅下降。
RAG 不是完整的解決方案。2026 年的研究顯示,即使是接地的 RAG 系統,幻覺率仍維持在 3% 至 8% 之間,主要發生在檢索內容不完整或自相矛盾時。模型被迫在衝突來源中選擇,有時會自行綜合出一個新答案。RAG 是必要,但不充分。
對一家正在建立內部合規助理的香港金融服務公司而言,在公司政策手冊上做 RAG 是基本架構。沒有它,模型只能憑通用訓練數據回答,可能包含已廢止的法規或不適用的司法管轄區。有了它,模型被接地,但仍需上層的驗證層次。
企業幻覺應對的四層框架是甚麼?
四層框架把幻覺視為系統風險而非模型風險。四層是:檢索接地、輸出驗證、高風險輸出的人工複核,以及對「黃金數據集」的持續評估。每一層攔截上一層遺漏的錯誤。跳過任何一層都會留下結構性缺口,並在最壞情境中浮現。
第一層是檢索接地,通常透過 RAG 實現,將模型錨定在組織經驗證的源材料。
第二層是輸出驗證,由第二個模型或規則系統檢查回應是否符合已知失敗模式。對於引用,要驗證所引案件或來源是否實際存在;對於數字,要與源文件交叉比對。
第三層是針對符合既定風險門檻的輸出進行人工複核。會進入客戶面向文件的回應需人工審查,回答內部程序問題的回應或可豁免。
第四層是針對「黃金數據集」(包含代表性查詢及驗證正確答案)的持續季度評估。這是你在真實事件爆發前發現模型漂移的方式。
企業幻覺應對實際成本是多少?
應對成本一般佔 AI 部署底層成本的 30% 至 60%(按三年計)。跳過它的成本更高。一宗發生在客戶交付物、審計回應或監管申報中的高曝光幻覺事件,所產生的補救、聲譽與法律成本,可以遠超整個 AI 計劃三年預算。
應對中最大成本項是第三層人工複核。一家香港 200 人專業服務公司,每月運行 5,000 個 AI 輔助輸出,即使只審查其中 20%、每項 5 分鐘,每週也要約 80 小時複核時間。這筆成本必須在第一天就計入商業方案,而不是在第六個月才被發現。
最低成本項是第四層持續評估。一份維護良好的 300 至 500 條黃金數據集,季度審核一次,在整個計劃中槓桿最高。2026 年大多數企業仍跳過此層,能撐過首次監管查詢的,往往就是那些建立了黃金數據集的企業。
幻覺對 AI 治理與《個人資料條例》合規意味著甚麼?
對於受《個人資料(私隱)條例》及金管局、證監會、保監局等行業法規約束的香港企業而言,幻覺不只是品質問題,更是治理問題。一個錯誤陳述個人資料、財務建議或監管義務的幻覺輸出,無論是否經人工審核,都可能構成合規違規。
個人資料私隱專員公署 2024 年發布並在 2026 年更新的 AI 個人資料處理指引,原則清晰:AI 輸出的問責由部署機構承擔,而非模型供應商。如果香港銀行部署的 AI 工具產生一段與個人資料相關的虛構建議,問責對象是該銀行,而非 OpenAI 或 Anthropic。
實際含義:2026 年的 AI 治理文件,必須包括一份書面幻覺應對政策,並為四層框架的每一層指定責任人。監管機構在巡查時,已開始要求查閱這份文件。
策略總結:把幻覺視為系統問題,而非模型問題
2026 年能在受監管流程中成功部署 AI 的企業,是那些已停止把幻覺視為「下一代模型會解決」的問題的企業。新模型確實會改善基線,但結構性特徵仍在。真正的功夫在系統層面:接地、驗證、高風險輸出的人工審查,以及對黃金數據集的持續評估。
對香港企業領袖而言,這重新定義了 AI 部署的對話。問題不是「這個模型夠好嗎」,而是「我們圍繞這個模型建立的系統夠好嗎」。這個區別,分隔了可被辯護的 AI 計劃與會釀成代價高昂事件的計劃。
懂AI的冷,更懂你的難 — UD 同行28年,讓科技成為有溫度的陪伴。
準備好為你的 AI 部署建立幻覺應對框架?
理解了四層框架,下一步是把它對應到你的具體使用場景與風險門檻。UD 團隊手把手帶你完成每一步,從使用場景風險評估、架構設計、供應商選型,到治理文件撰寫,28 年企業服務經驗,全程陪你走。