Google 發布 Gemini 3.1 Pro:推理能力翻倍,重回頂級 AI 模型行列

2026 年 2 月 19 日,Google 推出了新一代模型 Gemini 3.1 Pro(Preview)。距離 Gemini 3 Pro 上線僅約三個月,本次更新的最大亮點是推理能力大幅提升,同時維持原有定價,並以預覽版形式向開發者、企業與一般用戶全面開放。

在去年 11 月 Gemini 3 Pro 剛推出時曾短暫登上頂尖模型行列,但隨後被其他模型超越。根據第三方評測機構 Artificial Analysis 的數據,Gemini 3.1 Pro 在綜合智能表現上再次回到領先位置,重新進入第一梯隊。

推理能力成為本次最大突破

Gemini 3.1 Pro 的核心升級集中在高階推理能力。
在測試模型解決全新邏輯問題能力的 ARC-AGI-2 基準中,分數從上一代的 31.1% 大幅提升至 77.1%,成長超過一倍,顯示其在未知模式推理方面有明顯進步,並超越多數競品模型。

在高難度學術推理測試 Humanity’s Last Exam 中,Gemini 3.1 Pro 也取得更高分數,整體表現優於多款主流模型。同時,在評估科學知識理解能力的 GPQA Diamond 測試中,該模型拿到目前最高水準的成績,進一步強化其在複雜知識推理與理解上的優勢。

整體而言,這一代模型特別強調深度思考、邏輯推演與跨領域理解能力的提升。

編碼能力與 Agent 任務同步強化

除了推理能力外,Gemini 3.1 Pro 在程式開發與自動化代理(Agent)任務上的表現也顯著提升。

在競賽級程式能力測試 LiveCodeBench Pro 中,其評分大幅上升,顯示模型在寫程式、解題與演算法能力上有明顯進步。而在實務程式修復測試 SWE-Bench Verified 中,表現已與頂級模型幾乎持平,代表其在真實工程場景中的實用性大幅提高。

Agent 能力方面提升更為明顯。在長鏈任務測試中,成功率接近翻倍,顯示模型在處理多步驟、複雜流程任務時更穩定。同時,在搜尋型 Agent 評測中排名第一,代表其在資訊檢索與任務執行整合方面具有優勢。
此外,Google 也推出專門優化 Agent 使用場景的 custom tools 端點,支援結合 Bash 指令與自訂函式的混合操作。

並非所有評測全面領先

雖然 Gemini 3.1 Pro 在多項推理與綜合能力測試中表現突出,但並未在所有維度全面領先。
例如在 LM Arena 的使用者投票排名中,部分競品模型在文本品質與程式能力上仍維持優勢;而在專家級任務測試中,也有模型取得更高分。這反映目前 AI 發展仍屬多強競爭格局,不同模型在不同任務領域各有強項。

開發者重要更新與 API 改進

在開發者體驗方面,本次版本帶來多項實用更新。
檔案上傳限制由 20MB 提升至 100MB,使大型資料分析更加方便;同時新增可直接輸入 YouTube URL 進行影片分析的功能,強化多模態應用場景。

另外新增「medium thinking level」選項,讓開發者可以在推理深度與成本之間進行彈性調整,更適合實務部署。
需要注意的是,本次也包含破壞性變更,原本的 total_reasoning_tokens 欄位已更名為 total_thought_tokens,開發時需同步調整。

超大上下文與原生多模態能力

Gemini 3.1 Pro 支援最高 100 萬 token 的輸入上下文與 6.4 萬 token 的輸出長度,適合處理大型文件、程式碼庫與長內容分析。
模型同時具備原生多模態能力,可直接理解文字、圖片、音訊、影片以及程式碼資料,強化跨媒體應用的整合能力。

定價維持不變,性價比提升

在價格方面,Gemini 3.1 Pro 延續與 Gemini 3 Pro 相同的定價策略。
200k token 以內的輸入與輸出價格維持原標準,超過後則採用較高階梯費率。
在能力顯著提升但價格未調整的情況下,整體性價比被認為明顯提高,特別適合需要高推理能力與大型上下文的應用場景。

使用方式與開放管道

一般用戶可透過 Gemini App 與 NotebookLM 使用該模型,但需訂閱 Google AI Pro 或 Ultra 方案。
開發者則可透過 AI Studio、Gemini API、Gemini CLI、Vertex AI、Android Studio 與 Google Antigravity 等平台接入,模型識別名稱為「gemini-3.1-pro-preview」。

目前仍屬 Preview 階段

目前 Gemini 3.1 Pro 尚處於預覽版本,Google 表示將在進一步測試穩定性與實際應用表現後推出正式版。
整體來看,本次更新以「推理能力強化、Agent 任務提升與多模態整合」為核心,使 Gemini 系列重新回到頂級 AI 模型競爭行列。

如果您喜歡我們的網站,並且希望支持我們的工作,您可以考慮捐款。我們接受各種形式的捐款,包括一次性捐款和定期捐款。您的捐款將幫助我們維護和改進網站,並為用戶提供更好的體驗。

課程推薦

AI虛擬角色生成實戰班

AI虛擬角色生成實戰班

本課程將帶你從 AI 虛擬角色的概念出發,認識 AI Persona 的生成流程與應用方式,學會打造專屬自己的 AI 分身。課程中會學習 Prompt 提示詞撰寫、真人感人像生成、固定角色模板建立,並延伸出同一角色的多場景、多服裝與多情境照片。

OpenClaw 龍蝦 AI 代理人實作課:零基礎打造 AI 辦公代理人

OpenClaw 龍蝦 AI 代理人實作課:零基礎打造 AI 辦公代理人

本課程從安裝部署、身份設定、技能安裝到實戰應用,帶你從零建立一個專屬的 AI 工作助手-OpenClaw 龍蝦,這個 AI 助手可以替你蒐集情報、摘要文件、整理郵件、生成內容、定時提醒,全部自動完成。

輸入折扣碼 TC1625FR 還可以額外獲得 NT$500 優惠喔。

Google Gemini AI 多媒體生成工具應用實戰:從 Imagen 4、Veo 3、Chirp、Lyria 到 nano-banana

Google Gemini AI 多媒體生成工具應用實戰:從 Imagen 4、Veo 3、Chirp、Lyria 到 nano-banana

如何只用文字說明提示就生成不同的圖像結果?亦或是會議上的語音檔轉文字?這是一堂通盤性、全面性的Google Gemini AI多媒體生成工具應用實戰!

輸入折扣碼 TC1609EW 還可以額外獲得 NT$500 優惠喔。

AI 數據自動化工具實戰班:Google Sheet x Apps Script x NotebookLM 暨資料處理函數

AI 數據自動化工具實戰班:Google Sheet x Apps Script x NotebookLM 暨資料處理函數

本門課將教你如何善用 AI 功能與工具,進行自動分析數據提供有幫助的建議與洞察,以及使用 AI 驅動的公式自動化計算。

輸入折扣碼 TC1615VU 還可以額外獲得 NT$500 優惠喔。

3 小時掌握自動化工作新手應用實作 – n8n AI Agent

3 小時掌握自動化工作新手應用實作 – n8n AI Agent

這門課程將帶你循序漸進掌握 n8n 的自動化技巧,從基礎認識與操作入門,到進階節點應用與流程控制,再到 Google 服務的整合實作,最後延伸至部署思維與 OpenAI API 的智慧化串接。

輸入折扣碼 TC1600UY 還可以額外獲得 NT$500 優惠喔。

用 AI 生成網站? AI 高效網站設計實戰課:ChatGPT X HTML X SEO

用 AI 生成網站? AI 高效網站設計實戰課:ChatGPT X HTML X SEO

利用 AI 提升網站設計效率與 SEO 排名!了解如何透過 ChatGPT 等工具快速建立 HTML 架構,優化關鍵字與用戶體驗,讓網站更具競爭力。

輸入折扣碼 TC1533SL 還可以額外獲得 NT$500 優惠喔。

AI工作術全面學習實戰營:6 堂精選課程,學會最好用 AI 工具,翻轉你的人生

AI工作術全面學習實戰營:6 堂精選課程,學會最好用 AI 工具,翻轉你的人生

《PChome雜誌》攜手 5 位在 AI 領域的專業講師,打造上述 6 堂實用課程,教你學會時下最好用的 AI 工具,導入生成式 AI 來產製工作內容,改造並升級你的工作流程。

輸入折扣碼 ZERO2024 還可以額外獲得 NT$400 優惠喔。

HTML與SEO實戰應用—並以ChatGPT助力提升網站品質與流量

HTML與SEO實戰應用—並以ChatGPT助力提升網站品質與流量

本課程專為希望深入了解 HTML 並有效結合 SEO 策略的學員設計。我們將重點放在 HTML 的深度學習與應用上,同時穿插介紹如何透過搜索引擎優化提升網站能見度。透過即時互動式的直播教學,加上 ChatGPT 的輔助,您將學習到如何建立一個結構優良、美觀且符合 SEO 標準的網站。這不僅會提升網站的用戶體驗,還會大幅提高網站的搜索引擎排名,進而增加訪客流量和潛在客戶。
用AI強化職場競爭力 ChatGPT、Midjourney從入門到精通

用AI強化職場競爭力 ChatGPT、Midjourney從入門到精通

在快速變遷的職場中,提升競爭力成為關鍵。透過引領潮流的AI技術,ChatGPT和Midjourney將助您勇攀高峰。無論您是AI新手還是專家,這個課程將引導您從入門到精通,解密AI的奧秘,並學習如何運用於職場。
GitHub Copilot AI 程式碼編輯工具應用實務班

GitHub Copilot AI 程式碼編輯工具應用實務班

讓學員瞭解有效地使用該工具來加速開發流程、提高程式碼品質和生產力。課程重點放在以 JavaScript 程式語言為例,介紹 Copilot 的基本原理、使用方法和最佳實踐。

輸入折扣碼 TC1456JA 還可以額外獲得 NT$500 優惠喔。

ChatGPT X Clipchamp AI 生成影片、配音與字幕應用實戰班

ChatGPT X Clipchamp AI 生成影片、配音與字幕應用實戰班

掌握Clipchamp AI的操作技巧,靈活運用Clipchamp AI進行影片編輯和創作,實現創意表達和傳播目的。

輸入折扣碼 TC1451JAN 還可以額外獲得 NT$500 優惠喔。

如何串接多種數位工具資訊?Looker Studio 資料視覺化實戰班|GoogleAds x FB廣告 x GA流量數據

如何串接多種數位工具資訊?Looker Studio 資料視覺化實戰班|GoogleAds x FB廣告 x GA流量數據

Looker Studio除了可協助使用者監控網站流量、廣告成效、選擇匯入資源的管道之外,還可以將數據資料多平台整合、數據報表即時更新、數據範本可重複套用的效益,透過自動化系統,將數據全部匯入同一個報表平台,是企業不可或缺的重要工具。

輸入折扣碼 TC1270JIA 還可以額外獲得 NT$500 優惠喔。

和我們交流

加入我們的社群,裡面會有一些技術的內容、有趣的技術梗,以及職缺的分享,歡迎和我們一起討論。