OpenAI
GPT-5
總分
92
OpenAI 先前的旗艦推理模型,適合 coding、agent 任務與廣泛專業工作。
reasoningcodingagentic
上下文視窗
400K tokens
速度
均衡
當重點是交付可靠可用的程式,而不是只看表面效果。
重點放在可靠性、diff 品質、工具呼叫控制,以及跨多檔案編修時的持續專注能力。
推薦組合
OpenAI
OpenAI 先前的旗艦推理模型,適合 coding、agent 任務與廣泛專業工作。
Anthropic
Anthropic 較均衡的 Claude 層級,適合廣泛 production、coding 與 agent 編排。
DeepSeek
DeepSeek 的 thinking API SKU,對應 DeepSeek-V3.2 模型版本。
Coding 與開發工具 · CLI coding agent
OpenAI 的終端優先 coding agent,可編輯程式、執行指令並進行 agent 式開發迴圈。
Coding 與開發工具 · CLI coding agent
Anthropic 的終端 coding agent,適合 repo 工作、重構、debug 與程式生成。
瀏覽器與網頁互動 · Browser automation
現代化瀏覽器自動化框架,適合穩定的 UI 腳本、測試與網頁互動。
執行環境與沙盒 · Hosted execution
給 agents 使用、較安全的託管程式執行沙盒。