#19498 Scaling Trusted Access for Cyber with GPT-5.5 and GPT-5.5-Cyber
OpenAI 釋出了專為網路安全領域優化的 GPT-5.5-Cyber 模型,並透過 Trusted Access 計畫提供給資安防禦者。這不僅是為了加速漏洞研究和修復,更是將頂尖 AI 能力直接賦能於關鍵基礎設施保護,代表了 AI 在專業垂直領域的深度應用。
💬 這代表頂尖模型正針對特定領域(如資安)進行深度優化,你可以預期未來將有更多專用 AI 工具來輔助你的 DevSecOps 工作流程。
#19503 OpenAI models, Codex, and Managed Agents come to AWS
OpenAI 宣布其模型、Codex 及 Managed Agents 正式在 AWS 上提供,讓企業能在自己的 AWS 環境中安全地建構 AI 應用。這項合作大幅降低了在 AWS 上使用 OpenAI 技術的整合門檻與數據安全疑慮,是雙方結盟對抗其他雲端與 AI 巨頭的關鍵一步。
💬 你現在可以直接在 AWS 環境中以更安全、更整合的方式使用 OpenAI 的最新模型,簡化了架構設計並降低了數據洩漏風險。
#19566 What's new in Claude Sonnet 5
Anthropic 推出了 Claude Sonnet 5,定位於比 Opus 更便宜、速度更快的 agentic 模型,但這篇分析揭示其新的分詞器 (tokenizer) 反而讓英文處理成本增加了約 40%。這提醒我們在評估新模型時,不能只看宣傳的 token 定價,必須深入了解其技術細節對實際成本的影響。
💬 在選擇或升級 LLM 時,你需要對其 tokenizer 進行實際測試,因為定價策略的改變可能隱含著實際成本的顯著上升。
#19561 Ornith-1.0: self-improving open-source models for agentic coding
Ornith-1.0 是一個專注於 agentic coding 的開源模型,其創新之處在於採用了「自我改進」(self-improving) 的訓練機制。這代表模型能透過解決程式設計問題的經驗來持續迭代優化自身,為開源編碼 AI 的發展提供了新的可能性。
💬 開源社群正在探索能自我演化的程式碼生成模型,值得關注這類技術是否能成為你開發流程中更可靠的 AI pair programmer。
#19507 Scaling Security Insights: how we achieved a 10x increase in global scanning capacity
Cloudflare 分享了他們如何將安全掃描系統的吞吐量提升 10 倍,而無需增加任何硬體。文章深入探討了 Kafka、Postgres 和 API 的具體優化細節,是個關於大規模分散式系統性能調優的絕佳實戰案例。
💬 這篇文章提供了在不增加成本的情況下,如何透過軟體優化來實現系統吞吐量指數級增長的具體思路與方法。
#19485 Core dump epidemiology: fixing an 18-year-old bug
OpenAI 分享了一次精彩的 debug 過程,他們透過大規模分析核心轉儲 (core dump) 來追蹤罕見的基礎設施崩潰問題。最終不僅發現了硬體故障,還意外揪出一個潛伏長達 18 年的軟體 bug,展現了在超大規模系統下,如何結合數據分析與系統工程來解決棘手問題。
💬 這篇文章提供了一種在超大規模環境下進行根本原因分析(RCA)的系統性方法,展示了如何將看似無關的 crash log 轉化為可執行的洞察。
#19557 What happens when you run a CUDA kernel?
這篇文章深入淺出地拆解了執行一個 CUDA kernel 的完整生命週期,從 host 端程式碼到 GPU 上的實際運作。對於任何希望優化 AI/ML 工作負載效能的工程師來說,理解底層的硬體互動機制至關重要。
💬 了解 CUDA kernel 的運作原理,能幫助你更有效地進行 GPU 資源調度與性能瓶頸分析,從而榨乾硬體的每一分效能。
#19506 How GitHub maintains compliance for open source dependencies
GitHub 的開源計畫辦公室(OSPO)分享了他們如何使用自家的授權合規產品來管理大規模的開源相依性。文章提供了在大型企業中,如何自動化處理軟體供應鏈中授權風險的實用見解與工作流程。
💬 這提供了在 DevSecOps 流程中自動化管理開源授權合規性的實踐藍圖,有助於降低你所在組織的法律風險。