← 返回列表

2026-03-15 技術情報

抓取 37 篇 篩選 26 篇 精選 8 篇
AI

#938 Introducing GPT-5.4

OpenAI 發布了其新一代旗艦模型 GPT-5.4,在程式編寫、電腦操作等方面達到頂尖水準,並支援百萬級 token 上下文。這不僅為專業 AI 應用樹立了新標竿,其強大的能力更將催生出更複雜、更具實用性的 AI 代理與開發工具。

DevSecOps

#935 Codex Security: now in research preview

OpenAI 推出了專為應用程式安全設計的 AI 代理 Codex Security,能分析專案上下文以發現、驗證並修復複雜漏洞。這標誌著 DevSecOps 正邁向 AI 原生時代,旨在透過提供高精準度的自動化修補建議,大幅降低傳統安全工具的雜訊與開發者負擔。

AI

#928 Designing AI agents to resist prompt injection

本文揭示了 OpenAI 在設計 AI 代理時防禦提示詞注入(Prompt Injection)的關鍵策略,核心在於限制高風險操作與保護敏感資料。對於所有開發 LLM 應用的工程師而言,掌握這些防禦性設計模式是構建安全、可靠 AI 服務的必修課。

DevSecOps

#933 OpenAI to acquire Promptfoo

OpenAI 宣布收購 AI 安全平台 Promptfoo,該平台專注於在開發階段識別 AI 系統的漏洞。此次收購凸顯了結構化測試與評估(LLMOps)在 AI 開發流程中的核心地位,意味著對 AI 進行紅隊演練和弱點掃描正從選配變為標配。

AI

#930 From model to agent: Equipping the Responses API with a computer environment

本文深入解析了 OpenAI 如何為其 API 打造一個具備電腦環境的代理運行時(agent runtime),透過 Shell 工具和容器化環境賦予模型執行、儲存和與檔案互動的能力。這為開發者將無狀態的 LLM 轉化為能解決複雜任務的實用代理提供了極具價值的架構藍圖。

Cloud

#946 OpenAI and Amazon announce strategic partnership

OpenAI 宣布與 Amazon 建立戰略合作夥伴關係,將其前沿模型平台引入 AWS。此舉為企業級 AI 基礎設施提供了微軟 Azure 之外的另一頂級選擇,並預示著 AI 將與 AWS 生態系進行更深度整合,對雲端 AI 格局影響深遠。

Cloud

#945 Introducing the Stateful Runtime Environment for Agents in Amazon Bedrock

Amazon Bedrock 推出為 AI 代理設計的「狀態化運行環境」,為多步驟的複雜任務提供流程編排、記憶體管理和安全執行等底層支援。這項服務將運行 AI 代理所需的核心基礎設施產品化,大幅降低了開發門檻,也顯示出「託管代理運行時」正成為雲端服務商的關鍵競爭領域。

Engineering

#954 Why we no longer evaluate SWE-bench Verified

OpenAI 指出主流的程式編寫基準測試 SWE-bench Verified 存在數據污染和設計缺陷,已無法準確衡量頂尖模型的真實能力。這篇文章對 AI 評測基準的可靠性提出了重要警示,提醒開發者在選擇模型時需審慎看待評測分數,並推動社群建立更嚴謹的評估標準。