#11 Introducing GPT-5.4
OpenAI 發布了其最新、最強大的前沿模型 GPT-5.4,在程式編寫、電腦使用和工具搜尋方面達到頂尖水準,並支援百萬級 token 上下文。這不僅是性能的迭代,巨大的上下文視窗將根本性地改變複雜任務的處理方式,對所有 AI 應用開發者都至關重要。
#9 Codex Security: now in research preview
Codex Security 是一個新的 AI 應用安全代理,能透過分析專案上下文來偵測、驗證和修復複雜漏洞。這項工具超越了傳統的靜態掃描,代表著 AI 驅動的自動化安全修復邁出了重要一步,有望大幅提升 DevSecOps 流程的效率與準確性。
#2 Designing AI agents to resist prompt injection
文章探討了 OpenAI 如何設計 AI 代理(Agent)來抵禦提示注入和社交工程攻擊,關鍵在於限制高風險操作與保護敏感資料。隨著 Agent 能力越來越強大,防範惡意指令劫持已成為所有 AI 應用開發者都必須面對的核心安全挑戰。
#5 Improving instruction hierarchy in frontier LLMs
OpenAI 提出一種新的訓練方法,讓模型學會優先處理來自可信來源的指令,從而增強其安全可控性。這項研究對於解決提示注入等安全問題至關重要,是建立更可靠、更安全的 AI 系統的基礎。
#3 From model to agent: Equipping the Responses API with a computer environment
本文揭示了 OpenAI 如何建構一個能讓模型安全執行、存取檔案與工具的代理運行環境(agent runtime)。這為開發者提供了建構自家 AI 代理的技術藍圖,對於將大型語言模型從「聊天機器人」轉變為能實際操作的「工作者」至關重要。
#1 Rakuten fixes issues twice as fast with Codex
日本樂天(Rakuten)透過導入 OpenAI Codex 將平均修復時間(MTTR)縮短了 50%,並自動化了 CI/CD 審查。這個案例具體展示了 AI 編碼助手在提升工程效率上的巨大商業價值,證明了其在加速軟體開發與維運生命週期的潛力。
#16 Introducing ChatGPT for Excel and new financial data integrations
OpenAI 將 GPT-5.4 的能力整合到 Excel 中,加速金融建模、研究與分析。將頂尖 AI 能力帶入 Excel 這個無處不在的工具,極大地降低了高階數據分析的門檻,可能改變許多行業的資料處理方式。