#14999 Introducing OpenAI Privacy Filter
OpenAI 釋出了一個開源權重 (open-weight) 模型,專門用於高效能地偵測和移除文本中的個人可識別資訊 (PII)。這對於需要在保護用戶隱私的前提下處理大量文本的應用至關重要,提供了一個比傳統方法更準確、更可控的解決方案。
💬 你現在有一個強大的開源工具可以整合到你的 CI/CD 或資料處理 pipeline 中,以自動化方式解決棘手的 PII 合規問題。
#15020 OpenAI unveils Lockdown Mode to protect sensitive data from prompt injection attacks
OpenAI 針對 Prompt Injection 攻擊推出了「鎖定模式」,旨在限制模型存取敏感資料或執行未授權的動作。這是一項關鍵的防禦層,雖然不能完全杜絕攻擊,但大幅提高了在 Agentic 工作流程中保護敏感資訊的安全性。
💬 當你建構的 AI Agent 需要處理敏感 data source 或 tool 時,這個新功能提供了一個官方的、必須評估的 security control。
#14996 Introducing workspace agents in ChatGPT
OpenAI 正式推出 Workspace Agents,這是一種能串連多個工具、自動化複雜工作流程的雲端 AI 代理。這代表著 AI 的應用從單純的問答生成,進化到可以實際執行多步驟任務的自主系統,是 Agentic AI 落地的重要一步。
💬 你需要開始思考如何將重複性的開發、維運或業務流程,透過 Agents 框架來自動化,這可能是下一個生產力倍增的機會點。
#15002 Introducing GPT-5.4 mini and nano
OpenAI 推出了 GPT-5.4 的小型化版本 mini 和 nano,專為需要低延遲、高吞吐量的場景(如程式碼輔助、工具使用)進行了優化。這使得在成本和效能敏感的應用中,也能使用到接近前沿模型的能力,對 AI 應用的普及至關重要。
💬 在設計 AI Agent 或功能時,你可以為不同的子任務選擇更具成本效益的模型,例如用 nano 做意圖分類、用 mini 執行工具呼叫。
#15008 Gemini 3.5: frontier intelligence with action
Google 發表了最新的 Gemini 3.5 模型系列,強調其結合了頂尖的智能與實際執行動作的能力。這代表 Google 的 AI 戰略核心正全面轉向 Agentic AI,與 OpenAI 正在激烈競爭,推動整個產業快速發展。
💬 評估新專案的基礎模型時,需要將 Gemini 3.5 系列納入考量,並持續關注其在工具使用和 Agentic flow 上的表現是否優於 OpenAI。
#15001 Enterprises power agentic workflows in Cloudflare Agent Cloud with OpenAI
Cloudflare 的 Agent Cloud 整合了 OpenAI 最新的模型,為企業提供一個安全、高效能的 AI Agent 部署和擴展平台。這標誌著一個重要趨勢:雲端基礎設施正在演變為專為 AI Agent 設計的執行環境,解決了部署、安全和全球擴展的難題。
💬 未來部署 AI Agent,你可能會優先考慮 Cloudflare Workers 這類的 Edge Runtime,而不是傳統的 VM 或容器,以獲得更低的延遲和更高的安全性。
#15015 Code Orange: Fail Small is complete. The result is a stronger Cloudflare network
Cloudflare 分享了其大規模內部工程專案「Code Orange」的成果,旨在透過新工具和自動化流程,讓基礎設施變更更安全、更有韌性。這篇文章深入探討了如何在複雜的大型系統中實踐「安全地快速部署」,對於任何追求系統穩定性的團隊都極具價值。
💬 這篇文章提供了在你的團隊中推動更安全的變更管理和 SRE 實踐的具體案例與靈感,例如建立自動化的 best-practice codex。
#14998 Speeding up agentic workflows with WebSockets in the Responses API
OpenAI 的工程師分享了他們如何使用 WebSockets 和連接範圍快取 (connection-scoped caching) 來顯著降低 Agent API 的延遲。這篇文章深入技術細節,展示了在 agent loop 中,網路開銷和模型推論時間同樣重要,對性能優化有深刻的啟發。
💬 在設計需要與 LLM 進行多輪即時互動的系統時,應考慮使用 Streaming 和 WebSockets 等技術,而不是傳統的 request-response 模式。