OpenAI 推出 GPT-5.4:更強推理、更少幻覺、支援 AI Agent

OpenAI 近期正式推出新一代模型 GPT-5.4。這一版本在推理能力、文件生成、電腦操作能力與真實工作場景的表現上都有顯著提升,被視為 OpenAI 目前最強的生產力 AI 模型之一。

與前一代 GPT-5.2 相比,GPT-5.4 不僅更準確,也更適合用於企業與專業工作流程,例如分析資料、撰寫文件、製作簡報或自動化執行任務。

以下帶你快速了解 GPT-5.4 的幾個核心突破。

 

一、AI 開始真正能完成「專業工作」

OpenAI 在新的評測 GDPval 中,測試 AI 在 44 種職業情境中的表現,例如:

  • 製作銷售簡報

  • 建立財務模型

  • 排班與行政管理

  • 製造流程設計

在這些測試中,GPT-5.4 在 83% 的比較中達到或超過專業人士水準,明顯高於 GPT-5.2 的 70.9%。

這代表 AI 已經不只是回答問題,而是可以直接產出「可用的工作成果」。

例如:

  • 商業簡報

  • Excel 財務模型

  • 專業報告

  • 營運分析文件

在實際測試中,人類評審 68% 的情況更偏好 GPT-5.4 製作的簡報

 

 

二、文件、Excel、簡報能力大幅提升

GPT-5.4 的設計特別針對 知識工作(knowledge work) 進行優化,例如:

文件生成

  • 長篇報告結構更完整

  • 更少錯誤與幻覺

Excel / 試算表

在模擬投資銀行分析師的 Excel 建模任務中:

  • GPT-5.4:87.3%

  • GPT-5.2:68.4%

顯示其 數據分析與建模能力明顯提升

簡報設計

GPT-5.4 生成的簡報在:

  • 視覺多樣性

  • 版面結構

  • 圖像使用

方面都比舊版本更好。

 

 

三、AI 可以直接操作電腦

GPT-5.4 的另一個重大突破是 原生的電腦操作能力(Computer Use)

它可以透過截圖理解畫面,並透過滑鼠與鍵盤操作完成任務,例如:

  • 在瀏覽器操作網站

  • 填寫表單

  • 寄送 email

  • 排行事曆

  • 操作軟體介面

在測試 AI 操作桌面系統的 OSWorld benchmark 中:

  • GPT-5.4 成功率:75%

  • GPT-5.2:47%

甚至 已超過人類平均表現(72%)

這也被視為 AI Agent 技術的重要里程碑。

 

 

四、視覺理解與文件解析能力更強

GPT-5.4 同時提升了 多模態能力,尤其是圖像與文件理解:

  • 可處理高解析度圖片

  • 更準確解析 PDF 或文件內容

  • 更擅長理解 UI 畫面

在 MMMU-Pro(視覺推理測試)中,GPT-5.4 的成功率達 81.2%,優於 GPT-5.2。

此外,模型現在可支援 最高 10.24M 像素的圖片輸入

 

 

五、幻覺更少、準確度更高

OpenAI 表示 GPT-5.4 是目前 最具事實準確性的模型

  • 單一事實錯誤下降 33%

  • 整體回答含錯誤的機率下降 18%

相比 GPT-5.2 有明顯改善。

這對於需要高準確度的場景(法律、金融、研究)尤其重要。

 

 

六、開發者與 AI Agent 的重要平台

GPT-5.4 同時整合了 GPT-5.3-Codex 的強大程式能力,並支援:

  • API

  • Codex

  • ChatGPT

  • Agent 系統

模型也支援 最高 1M token context window(實驗功能),可以處理超大型文件或程式碼專案。

這讓 GPT-5.4 成為 AI Agent、自動化系統與企業 AI 的核心模型

 

 

結語:AI 正在變成「數位員工」

GPT-5.4 的重點不只是更聰明,而是更 能完成真實工作

它具備:

  • 更強推理能力

  • 更好的文件與數據處理

  • 電腦操作能力

  • 更低的錯誤率

  • 更大的上下文

這意味著 AI 不再只是聊天工具,而是開始成為 真正能完成任務的 AI Agent 與數位員工

未來 AI 的發展,很可能不再只是「回答問題」,而是 直接幫你把工作完成

 

 

123456789101112131415

 

如果您喜歡我們的網站,並且希望支持我們的工作,您可以考慮捐款。我們接受各種形式的捐款,包括一次性捐款和定期捐款。您的捐款將幫助我們維護和改進網站,並為用戶提供更好的體驗。

課程推薦

AI虛擬角色生成實戰班

AI虛擬角色生成實戰班

本課程將帶你從 AI 虛擬角色的概念出發,認識 AI Persona 的生成流程與應用方式,學會打造專屬自己的 AI 分身。課程中會學習 Prompt 提示詞撰寫、真人感人像生成、固定角色模板建立,並延伸出同一角色的多場景、多服裝與多情境照片。

OpenClaw 龍蝦 AI 代理人實作課:零基礎打造 AI 辦公代理人

OpenClaw 龍蝦 AI 代理人實作課:零基礎打造 AI 辦公代理人

本課程從安裝部署、身份設定、技能安裝到實戰應用,帶你從零建立一個專屬的 AI 工作助手-OpenClaw 龍蝦,這個 AI 助手可以替你蒐集情報、摘要文件、整理郵件、生成內容、定時提醒,全部自動完成。

輸入折扣碼 TC1625FR 還可以額外獲得 NT$500 優惠喔。

Google Gemini AI 多媒體生成工具應用實戰:從 Imagen 4、Veo 3、Chirp、Lyria 到 nano-banana

Google Gemini AI 多媒體生成工具應用實戰:從 Imagen 4、Veo 3、Chirp、Lyria 到 nano-banana

如何只用文字說明提示就生成不同的圖像結果?亦或是會議上的語音檔轉文字?這是一堂通盤性、全面性的Google Gemini AI多媒體生成工具應用實戰!

輸入折扣碼 TC1609EW 還可以額外獲得 NT$500 優惠喔。

AI 數據自動化工具實戰班:Google Sheet x Apps Script x NotebookLM 暨資料處理函數

AI 數據自動化工具實戰班:Google Sheet x Apps Script x NotebookLM 暨資料處理函數

本門課將教你如何善用 AI 功能與工具,進行自動分析數據提供有幫助的建議與洞察,以及使用 AI 驅動的公式自動化計算。

輸入折扣碼 TC1615VU 還可以額外獲得 NT$500 優惠喔。

3 小時掌握自動化工作新手應用實作 – n8n AI Agent

3 小時掌握自動化工作新手應用實作 – n8n AI Agent

這門課程將帶你循序漸進掌握 n8n 的自動化技巧,從基礎認識與操作入門,到進階節點應用與流程控制,再到 Google 服務的整合實作,最後延伸至部署思維與 OpenAI API 的智慧化串接。

輸入折扣碼 TC1600UY 還可以額外獲得 NT$500 優惠喔。

用 AI 生成網站? AI 高效網站設計實戰課:ChatGPT X HTML X SEO

用 AI 生成網站? AI 高效網站設計實戰課:ChatGPT X HTML X SEO

利用 AI 提升網站設計效率與 SEO 排名!了解如何透過 ChatGPT 等工具快速建立 HTML 架構,優化關鍵字與用戶體驗,讓網站更具競爭力。

輸入折扣碼 TC1533SL 還可以額外獲得 NT$500 優惠喔。

AI工作術全面學習實戰營:6 堂精選課程,學會最好用 AI 工具,翻轉你的人生

AI工作術全面學習實戰營:6 堂精選課程,學會最好用 AI 工具,翻轉你的人生

《PChome雜誌》攜手 5 位在 AI 領域的專業講師,打造上述 6 堂實用課程,教你學會時下最好用的 AI 工具,導入生成式 AI 來產製工作內容,改造並升級你的工作流程。

輸入折扣碼 ZERO2024 還可以額外獲得 NT$400 優惠喔。

HTML與SEO實戰應用—並以ChatGPT助力提升網站品質與流量

HTML與SEO實戰應用—並以ChatGPT助力提升網站品質與流量

本課程專為希望深入了解 HTML 並有效結合 SEO 策略的學員設計。我們將重點放在 HTML 的深度學習與應用上,同時穿插介紹如何透過搜索引擎優化提升網站能見度。透過即時互動式的直播教學,加上 ChatGPT 的輔助,您將學習到如何建立一個結構優良、美觀且符合 SEO 標準的網站。這不僅會提升網站的用戶體驗,還會大幅提高網站的搜索引擎排名,進而增加訪客流量和潛在客戶。
用AI強化職場競爭力 ChatGPT、Midjourney從入門到精通

用AI強化職場競爭力 ChatGPT、Midjourney從入門到精通

在快速變遷的職場中,提升競爭力成為關鍵。透過引領潮流的AI技術,ChatGPT和Midjourney將助您勇攀高峰。無論您是AI新手還是專家,這個課程將引導您從入門到精通,解密AI的奧秘,並學習如何運用於職場。
GitHub Copilot AI 程式碼編輯工具應用實務班

GitHub Copilot AI 程式碼編輯工具應用實務班

讓學員瞭解有效地使用該工具來加速開發流程、提高程式碼品質和生產力。課程重點放在以 JavaScript 程式語言為例,介紹 Copilot 的基本原理、使用方法和最佳實踐。

輸入折扣碼 TC1456JA 還可以額外獲得 NT$500 優惠喔。

ChatGPT X Clipchamp AI 生成影片、配音與字幕應用實戰班

ChatGPT X Clipchamp AI 生成影片、配音與字幕應用實戰班

掌握Clipchamp AI的操作技巧,靈活運用Clipchamp AI進行影片編輯和創作,實現創意表達和傳播目的。

輸入折扣碼 TC1451JAN 還可以額外獲得 NT$500 優惠喔。

如何串接多種數位工具資訊?Looker Studio 資料視覺化實戰班|GoogleAds x FB廣告 x GA流量數據

如何串接多種數位工具資訊?Looker Studio 資料視覺化實戰班|GoogleAds x FB廣告 x GA流量數據

Looker Studio除了可協助使用者監控網站流量、廣告成效、選擇匯入資源的管道之外,還可以將數據資料多平台整合、數據報表即時更新、數據範本可重複套用的效益,透過自動化系統,將數據全部匯入同一個報表平台,是企業不可或缺的重要工具。

輸入折扣碼 TC1270JIA 還可以額外獲得 NT$500 優惠喔。

和我們交流

加入我們的社群,裡面會有一些技術的內容、有趣的技術梗,以及職缺的分享,歡迎和我們一起討論。