這個研究代理會替你閱讀 160 個來源
Gemini 有一項功能叫 Deep Research Max,能對單一研究問題執行最多 160 次網絡搜尋,處理 90 萬個輸入詞元。大多數 Gemini 用戶從未觸碰過這項功能。少數使用過的人,正在悄悄地把過往需要整整一天的研究工作,壓縮成 30 分鐘的背景任務。
Google 在 2026 年 4 月 21 日推出 Deep Research Max,採用全新的 Gemini 3.1 Pro 推理模型。這個功能與你在 ChatGPT 或 Claude 用過的東西完全不同。它不會直接回答你的問題,而是先建立研究計劃、執行數十次搜尋、閱讀來源頁面、調整策略,最後產出一份附引用來源的結構化報告。
這不是 2024 年底推出的初版 Deep Research。新版本處理的查詢量大約是舊版的兩倍,能透過 MCP 整合私人資料,並在 DeepSearchQA 評測上拿到 93.3% 的分數,比 12 月的 66.1% 大幅提升。如果你日常工作涉及研究、市場分析、競爭情報或盡職調查,這是本季度最具影響力的 AI 功能之一。
本文會說明它實際上能做什麼、何時值得使用、能產出最乾淨報告的提示結構,以及它在哪些任務上會崩潰。
什麼是 Gemini Deep Research Max?
Deep Research Max 是 Google 在 Gemini 內建的自主研究代理,專為需要綜合上百個來源並產出引用報告的精準度敏感型調查而設計。它運行於 Gemini 3.1 Pro,每次任務最多執行 160 次網絡搜尋,可處理高達 90 萬個輸入詞元,任務通常於背景執行 20 至 60 分鐘。
標準版 Deep Research 約處理 80 次查詢、25 萬個輸入詞元,20 分鐘內完成。Deep Research Max 是更重型的版本,適用於要求全面性高於速度的任務。
整個代理分四階段運作。第一階段,將你的問題拆解為子問題。第二階段,從多角度產生覆蓋題目的搜尋查詢。第三階段,閱讀來源頁面的實際內容,而非只看摘要。第四階段,反覆檢視找出缺口,調整策略,直至報告完成。
產出是一份附行內引用的結構化文件,通常包含由來源資料生成的圖表與表格。執行前你可以查看完整的研究計劃並編輯,避免代理誤解研究範圍。
Deep Research Max 何時值得使用?
當問題範圍夠廣需要多個子調查、答案需要引用來源、而且你能等候 20 至 60 分鐘時,就適合使用 Deep Research Max。對於快速事實查詢、即時跟進或單一來源問題,標準 Gemini 對話更快、更便宜。
有三類任務最能展現它的價值。市場與競爭分析:產出一份 20 頁的行業報告,涵蓋主要參與者、近期動向、價格資料。盡職調查:在做決策前調查一家公司、某項法規或某個技術供應商。趨勢報告:將某個快速變動主題的討論、新聞、學術研究整合在一份文件中。
成本現實值得留意。一次 Deep Research Max 任務通常消耗 50 萬至 200 萬詞元,按 API 計費,單次任務介乎 2 至 15 美元。在 Gemini 應用程式 AI Pro 或 AI Ultra 訂閱層級,這是訂閱配額內的功能,但任務會計入每日上限。
需要即時資料、答案來自單一權威來源、或你 2 分鐘 Google 就能驗證的任務,請略過這個工具。它是為大規模綜合而設計,不是為速度。
怎樣寫出能產生有用報告的提示?
決定產出質素的最大因素,是輸入提示的結構。模糊的問題只會產出膚淺的報告。包含明確子問題、來源偏好與輸出格式的結構化提示,會產出你能直接使用、不需重寫的報告。
有效的框架包含四個元素。目標:說明這份報告要支援的決策,而非只說題目。子問題:列出五至十個報告必須回答的具體問題。來源指引:告訴代理優先採用哪些來源、降低哪些來源的權重。輸出格式:明確指定結構,包括章節標題、表格格式與必要的比較。
以下是可複製套用的完整提示範本:
立即試用此提示:
我正在評估 [主題] 以支援 [具體決策]。請產出研究報告,回答以下子問題:
1. [具體問題 1]
2. [具體問題 2]
3. [具體問題 3]
4. [具體問題 4]
5. [具體問題 5]
來源優先順序:
--- 優先採用:官方文件、同行評審研究、過去 12 個月內公佈的財務報告、具名高層的公開發言。
--- 降低權重:市場部落格、內容農場、無資料支援的觀點文章、超過 24 個月的來源(除非需要歷史脈絡)。
輸出格式:
--- 行政摘要,5 個要點,每個 25 字以內。
--- 每個子問題一個 H2 章節,包含 60 字答案摘要、附行內引用的支持證據、必要時加上比較表。
--- 最後一節:尚未解答的問題與現有研究的缺口。
語氣:分析性、中立、無行銷用語。每個數字宣稱必須附引用。
這個範本強迫代理在規劃階段就鎖定結構,從而平均分配搜尋資源到每個子問題,避免某一面向被過度調查、其他面向卻被忽略。
怎樣讓 Deep Research Max 產出穩定一致的結果?
一致性來自三個變數的控制:研究範圍、來源偏好,以及執行前的計劃審查步驟。代理允許你在執行搜尋之前審查並編輯計劃,這是整個功能裡最被低估的控制點。
當你提交提示後,代理會先生成一份計劃,通常是 8 至 15 個子調查,每個都附建議的搜尋查詢與來源類型。任何一項你都可以編輯。如果計劃涵蓋了不相關的方向,或漏掉關鍵子問題,就在這裡修正。花 5 分鐘編輯計劃,能避免 30 分鐘後拿到一份偏離重點的報告。
第二個一致性槓桿是時效控制。預設情況下代理不會限制來源日期。如果你調查的是過去 6 個月內的快速變動議題,請明確設定截止日期:「只引用 [日期] 之後發佈的來源。如果關鍵論點需要較舊來源,請明確標註。」這能避免報告依賴過時的 2023 年文章。
第三個槓桿是矛盾處理。真實研究中來源彼此矛盾很常見。請告訴代理如何處理:「當來源彼此分歧時,呈現兩種立場,註明各自來源,並解釋方法學差異。不要默默選邊。」沒有這條指令,代理通常會預設採用引用最多的立場,即使那是較弱的一方。
Deep Research Max 在哪裡會崩潰?
Deep Research Max 在三類工作上表現不佳:即時資料、網絡覆蓋稀薄的冷門技術主題,以及答案需要超越來源材料進行推理的任務。了解失效模式能避免你浪費 30 分鐘執行一份它無法妥善處理的任務。
第一個失效模式是即時資料。如果你問「目前股價」或「今天的匯率」,代理只會抓取搜尋過程中出現的快取數字,往往已過時數小時甚至數天。這類查詢請改用標準 Gemini 對話的即時搜尋。
第二個失效模式是來源覆蓋稀薄。代理的能力只能匹配它能找到的來源。對於非常狹窄的技術主題、地區性法規問題或冷門行業,報告可能會被相鄰素材填充,但這些素材其實沒有回答你的問題。如果懷疑來源稀薄,先用標準 Gemini 搜尋一次,評估真實素材有多少。
第三個失效模式是原創分析。代理只會綜合來源裡已有的內容。它不會產生真正全新的分析框架,也不會獨立驗證有爭議的論點。如果你的問題是「這個論點是否成立」而非「專家怎麼說」,你需要的是另一種工具,通常是與 Claude 或 GPT-5.5 進行來回對話。
誠實的總結:Deep Research Max 是目前最強的 AI 工具,能將既有知識綜合成結構化引用報告。但它無法取代領域專家、即時資料來源,或你自己對綜合結果意義的判斷。
Deep Research Max 與 ChatGPT Deep Research、Claude Research 怎樣比較?
三大 AI 廠商現在都推出了研究代理。各自強項不同,正確選擇取決於你需要哪一類報告。截至 2026 年 5 月,Deep Research Max 在評測分數和來源覆蓋上領先,ChatGPT Deep Research 在對話深度上領先,Claude Research 在文件接地分析上領先。
Deep Research Max 在 DeepSearchQA 拿到 93.3%,在 Humanity's Last Exam 拿到 54.6%。運行於 GPT-5.5 的 ChatGPT Deep Research 在 DeepSearchQA 拿到 91.2%。分數接近,但實際差別在於它們處理模糊性的方式。Deep Research Max 傾向列舉可能性並引用來源分歧。ChatGPT Deep Research 通常產出更有信心的敘事式答案。
對於競爭分析或市場報告,Deep Research Max 是較佳選擇,因為來源上限更高,且原生支援視覺化。對於探索性思考或需要來回精煉的題目,ChatGPT Deep Research 更靈活。對於分析特定文件集或你自己上傳的研究資料,Claude Research 在長上下文接地上處理得更好。
如果你只想長期使用一個工具,Deep Research Max 目前的輸出結構最強。如果你已付費使用 ChatGPT Plus 或 Claude Pro,是否切換的邊際價值取決於你多常需要一份完整引用的 20 頁報告,而非快速分析答案。
立即試用:30 分鐘的實測
學會 Deep Research Max 能做與不能做的最佳方法,是用一個你已知答案的問題做一次測試。這能校準你對實際使用的期望。
挑一個你過去三個月內手動研究過的題目:競爭對手、市場、法規、技術。用上面的提示範本產出一份結構化報告。把產出與你自己的研究結果對照。
你會留意到三件事。第一,代理找到你錯過的來源。第二,它也漏掉一些你找到的,尤其是付費牆後或需要登入的內容。第三,綜合結果不錯但偏通用,大致相當於一位有一天時間的稱職分析師會交出的報告。理解這個基準後,你才能決定它能在你實際工作流程的哪一環增加價值。
大多數整合 Deep Research Max 的實踐者,把它用在特定一類任務:每週競爭對手監察、每季市場掃描、會前公司或行業簡報。他們不會用它處理日常問題、即時資料,或任何速度比深度更重要的工作。
這就是「使用 AI 工具」與「被 AI 工具限制」的分界線。目前真正領先的人,不是寫得出更聰明提示的人,而是知道在哪個任務該用哪個工具、知道每個工具實際擅長什麼、知道哪些事仍要交給人類判斷的人。懂AI的冷,更懂你的難 — UD 同行28年,讓科技成為有溫度的陪伴。
圍繞這類工具建立可靠的 AI 工作流程
會用 Deep Research Max 只是第一步。把它整合進每週都能穩定運行的工作流程,才是下一步的關鍵。UD 團隊手把手帶你完成每一步,從工具選型、提示範本到實際部署,讓 AI 在你的工作中真正持續產生價值。