ORIEN — 2026-03-15 技術情報

AI

#938 Introducing GPT-5.4

OpenAI 發布了其新一代旗艦模型 GPT-5.4，在程式編寫、電腦操作等方面達到頂尖水準，並支援百萬級 token 上下文。這不僅為專業 AI 應用樹立了新標竿，其強大的能力更將催生出更複雜、更具實用性的 AI 代理與開發工具。

openai-blog · 閱讀原文

DevSecOps

OpenAI 推出了專為應用程式安全設計的 AI 代理 Codex Security，能分析專案上下文以發現、驗證並修復複雜漏洞。這標誌著 DevSecOps 正邁向 AI 原生時代，旨在透過提供高精準度的自動化修補建議，大幅降低傳統安全工具的雜訊與開發者負擔。

openai-blog · 閱讀原文

AI

本文揭示了 OpenAI 在設計 AI 代理時防禦提示詞注入（Prompt Injection）的關鍵策略，核心在於限制高風險操作與保護敏感資料。對於所有開發 LLM 應用的工程師而言，掌握這些防禦性設計模式是構建安全、可靠 AI 服務的必修課。

openai-blog · 閱讀原文

DevSecOps

OpenAI 宣布收購 AI 安全平台 Promptfoo，該平台專注於在開發階段識別 AI 系統的漏洞。此次收購凸顯了結構化測試與評估（LLMOps）在 AI 開發流程中的核心地位，意味著對 AI 進行紅隊演練和弱點掃描正從選配變為標配。

openai-blog · 閱讀原文

AI

本文深入解析了 OpenAI 如何為其 API 打造一個具備電腦環境的代理運行時（agent runtime），透過 Shell 工具和容器化環境賦予模型執行、儲存和與檔案互動的能力。這為開發者將無狀態的 LLM 轉化為能解決複雜任務的實用代理提供了極具價值的架構藍圖。

openai-blog · 閱讀原文

Cloud

OpenAI 宣布與 Amazon 建立戰略合作夥伴關係，將其前沿模型平台引入 AWS。此舉為企業級 AI 基礎設施提供了微軟 Azure 之外的另一頂級選擇，並預示著 AI 將與 AWS 生態系進行更深度整合，對雲端 AI 格局影響深遠。

openai-blog · 閱讀原文

Cloud

Amazon Bedrock 推出為 AI 代理設計的「狀態化運行環境」，為多步驟的複雜任務提供流程編排、記憶體管理和安全執行等底層支援。這項服務將運行 AI 代理所需的核心基礎設施產品化，大幅降低了開發門檻，也顯示出「託管代理運行時」正成為雲端服務商的關鍵競爭領域。

openai-blog · 閱讀原文

Engineering

OpenAI 指出主流的程式編寫基準測試 SWE-bench Verified 存在數據污染和設計缺陷，已無法準確衡量頂尖模型的真實能力。這篇文章對 AI 評測基準的可靠性提出了重要警示，提醒開發者在選擇模型時需審慎看待評測分數，並推動社群建立更嚴謹的評估標準。

openai-blog · 閱讀原文