OpenAI
GPT-5
OpenAI 先前的旗艦推理模型,適合 coding、agent 任務與廣泛專業工作。
VerdictLens 用更清楚的取捨說明、官方連結與結構化資料,幫團隊瀏覽 AI 模型、工具層與實際使用場景。
快速 shortlist 概覽
先從模型列表縮小候選,再用 compare 一次檢查價格、速度、上下文視窗與工作流適配。
從這裡開始
你可以先看模型、先看支援工具,或直接從要完成的工作出發。首頁先把這三種決策路徑攤清楚。
精選模型
用更容易掃描的方式瀏覽主流模型,直接掌握價格、速度、優勢,並看到官方連結。
OpenAI
OpenAI 先前的旗艦推理模型,適合 coding、agent 任務與廣泛專業工作。
Anthropic
Anthropic 較均衡的 Claude 層級,適合廣泛 production、coding 與 agent 編排。
Google 在 Gemini 2.5 系列中最先進的模型,適合複雜推理與 coding 任務。
Perplexity
Perplexity 進階搜尋模型,提供更深內容理解與更高搜尋準確度。
精選技能
真正決定模型能不能穩定落地的,通常是工具與工作流層。這裡先把那一層整理得更好讀。
Coding 與開發工具 · CLI coding agent
OpenAI 的終端優先 coding agent,可編輯程式、執行指令並進行 agent 式開發迴圈。
記憶與知識層 · Workspace knowledge access
Notion 官方的 MCP 整合,可把 workspace 搜尋、頁面、留言與結構化資料來源暴露給 AI client。
執行環境與沙盒 · Containerized MCP gateway
Docker 的 gateway,可在容器化且較容易治理的環境中執行並代理 MCP servers。
Coding 與開發工具 · Agent skill installer and discovery CLI
Vercel 的 open skills CLI,可在多種 coding agents 之間探索、安裝與管理可重用的 agent skills。
使用場景
先從要完成的工作出發,再往下選最適合的模型與技能組合。
評分方式
模型分數 = 能力 30、場景適配 25、成本效率 15、速度 10、可靠性 10、Agent 就緒度 10。
技能分數 = 實用性 25、相容性 20、安裝難度 15、可靠性 15、文件品質 10、採用度 10、安全維護 5。
分數綜合 benchmark 訊號、產品體驗與編輯權重,適合拿來做實務判斷,不代表絕對真理。
給團隊與 AI 代理使用的結構化資料
每個端點都方便檢視、重用與索引,適合網站、內部工具、搜尋與 AI 回答引擎使用。