ORIEN — 2026-03-24 技術情報

DevSecOps 追蹤: AI 資安追蹤: devSecOps追蹤: AI 開發工具追蹤: 資安工具

#2390 Codex Security: now in research preview

OpenAI 推出了 AI 應用安全代理 Codex Security，它能理解專案的完整上下文，以更高準確度來偵測、驗證並修復複雜的安全漏洞。這將傳統的靜態掃描工具提升到能理解程式碼語意的新層次，大幅降低誤報率。

💬 你可以將它整合到 CI/CD 流程中，實現更智慧的自動化漏洞掃描與修復，從而在開發早期就解決深層次的安全問題。

openai-blog · 閱讀原文

DevSecOps 追蹤: AI 資安追蹤: devSecOps追蹤: AI 開發工具追蹤: 資安工具

#2410 GitHub expands application security coverage with AI‑powered detections

GitHub Code Security 將 CodeQL 與 AI 驅動的偵測技術相結合，擴大了對更多程式語言和框架的漏洞掃描覆蓋範圍。這代表著 AI 正在成為主流 DevSecOps 平台的核心能力，而不僅僅是獨立工具。

💬 你在 GitHub 上的專案將能自動獲得更廣泛、更精準的安全檢測，幫助你更快發現並修復潛在風險。

github-blog · 閱讀原文

DevSecOps 追蹤: AI 資安追蹤: devSecOps

#2383 Designing AI agents to resist prompt injection

OpenAI 分享了其防範 Prompt Injection 和社交工程攻擊的設計思路，核心是透過限制高風險操作和保護敏感資料來保障 Agent 工作流的安全性。這篇文章揭示了在 Agentic AI 時代，安全思維必須從單純的輸入過濾，轉向對 Agent 行為和權限的精細控制。

💬 在你設計 AI Agent 時，必須從架構層面考慮權限分離和風險控制，而不是僅僅依賴 Prompt 本身的防禦。

openai-blog · 閱讀原文

AI 追蹤: AI 開發工具

#2393 Introducing GPT-5.4

OpenAI 發布了其最強大、最高效的前沿模型 GPT-5.4，在程式碼、電腦操作和長達 100 萬 token 的上下文處理能力上都達到了頂尖水平。這不僅是能力的線性提升，更代表著 AI 在處理複雜專業任務上的新標竿。

💬 這意味著你現在可以利用更強的 AI 來處理更複雜的程式碼生成、重構和系統分析任務，甚至能讓它理解整個大型程式碼庫的上下文。

openai-blog · 閱讀原文

AI 後續追蹤: AI 資安追蹤: devSecOps追蹤: AI 開發工具

#2384 From model to agent: Equipping the Responses API with a computer environment

本文深入解析了 OpenAI 如何利用其 Responses API、shell 工具和容器化環境，建構出一個可擴展、安全的 Agent 執行時。這為開發者展示了一條將 LLM 從「聊天機器人」轉變為能操作檔案、工具和狀態的「自主代理」的技術路徑。

💬 這提供了一個官方的最佳實踐藍圖，教你如何建構一個穩定、可控的 AI Agent 執行環境，而不只是進行無狀態的 API 呼叫。

openai-blog · 閱讀原文

Cloud 後續追蹤: AI 資安追蹤: devSecOps追蹤: AI 開發工具

#2401 Introducing the Stateful Runtime Environment for Agents in Amazon Bedrock

隨著 OpenAI 與 Amazon 達成戰略合作，Amazon Bedrock 推出了為 AI Agent 設計的 Stateful Runtime。它為多步驟的 AI 工作流提供了持久化的任務協調、記憶體和安全的執行環境，解決了 Agent 在執行長序列任務時的狀態管理難題。

💬 你現在可以在 AWS 上建構和部署更複雜、有記憶、能執行長任務的 AI Agent，並與現有的雲端基礎設施無縫整合。

openai-blog · 閱讀原文

Cloud 後續

#2412 Launching Cloudflare’s Gen 13 servers: trading cache for cores for 2x edge compute performance

Cloudflare 的第 13 代伺服器透過一個反直覺的權衡——減少 L3 快取以換取更多 CPU 核心——實現了兩倍的邊緣計算吞吐量。這證明了在現代軟體堆疊下，硬體設計的傳統智慧需要被重新審視，以應對不斷變化的工作負載。

💬 這啟示我們在設計高效能系統時，必須考慮軟硬體協同設計，有時打破常規的硬體配置反而能帶來巨大的效能提升。

the-cloudflare-blog · 閱讀原文

AI 後續追蹤: AI 資安追蹤: AI 開發工具

#2409 Why we no longer evaluate SWE-bench Verified

OpenAI 指出 SWE-bench Verified 這個程式碼能力評測基準存在測試案例瑕疵和訓練資料洩漏的問題，已無法準確衡量前沿模型的進展。這篇文章提醒我們對 AI 模型的評測基準需要保持批判性思考，理解其局限性。

💬 當你評估或選擇程式碼生成模型時，不能只看單一 Benchmark 的分數，而需要更深入地理解評測方法本身是否合理。

openai-blog · 閱讀原文

Engineering 追蹤: AI 開發工具

#2423 RT Marcelo Trylesinski: Starlette 1.0 is here!🎉 After nearly eight years, Starlette has reached its first stable release. Downloaded almost 10 mill...

作為 FastAPI 等框架的底層基礎，高效能的 Python ASGI 框架 Starlette 終於發布了 1.0 穩定版。這對廣大的 Python 後端和 AI 服務開發者來說是一個里程碑，意味著一個更成熟、可靠的非同步網路開發基礎。

💬 你賴以建構高效能 AI 推理服務或後端 API 的核心依賴庫現在更加穩定，可以放心用於生產環境。

simon-willison-(@simonw) · 閱讀原文

💡 跨文章洞察

#2390 Codex Security: now in research preview

#2410 GitHub expands application security coverage with AI‑powered detections

#2383 Designing AI agents to resist prompt injection

#2393 Introducing GPT-5.4

#2384 From model to agent: Equipping the Responses API with a computer environment

#2401 Introducing the Stateful Runtime Environment for Agents in Amazon Bedrock

#2412 Launching Cloudflare’s Gen 13 servers: trading cache for cores for 2x edge compute performance

#2409 Why we no longer evaluate SWE-bench Verified

#2423 RT Marcelo Trylesinski: Starlette 1.0 is here!🎉 After nearly eight years, Starlette has reached its first stable release. Downloaded almost 10 mill...