AI 模型與工具探索指南

獨立整理的 AI 模型與技能目錄

更快選到適合的 AI 組合，少一點盲猜。

VerdictLens 用更清楚的取捨說明、官方連結與結構化資料，幫團隊瀏覽 AI 模型、工具層與實際使用場景。

瀏覽模型瀏覽技能從使用場景開始

01

29 個已驗證 AI 模型

02

1528 個 live skills，附設定摘要與官方連結

03

28 個編輯精選 · 547 個已驗證收錄 · 953 個更廣泛的目錄項目

快速 shortlist 概覽

如果已經有候選名單，直接把 2–3 個模型並排比較。

先從模型列表縮小候選，再用 compare 一次檢查價格、速度、上下文視窗與工作流適配。

GPT-5

OpenAI

Score

92

Claude Sonnet 4.6

Anthropic

Score

92

Gemini 2.5 Pro

Google

Score

91

打開比較工作台 →

從這裡開始

先從三條清楚路徑開始。

你可以先看模型、先看支援工具，或直接從要完成的工作出發。首頁先把這三種決策路徑攤清楚。

瀏覽模型

依供應商、價格、速度與適合場景快速掃描排名模型。

查看全部模型 →

瀏覽技能

直接看真正影響落地效果的工具層與工作流組件。

查看全部技能 →

從使用場景開始

先定義要完成的工作，再往下選模型與技能組合。

查看指南 →

精選模型

瀏覽 AI 模型

用更容易掃描的方式瀏覽主流模型，直接掌握價格、速度、優勢，並看到官方連結。

OpenAI

GPT-5

總分

92

OpenAI 先前的旗艦推理模型，適合 coding、agent 任務與廣泛專業工作。

reasoningcodingagentic

上下文視窗

400K tokens

速度

均衡

官方網站查看詳情

Anthropic

Claude Sonnet 4.6

總分

92

Anthropic 較均衡的 Claude 層級，適合廣泛 production、coding 與 agent 編排。

balancedcodingagents

上下文視窗

200K tokens

速度

均衡

官方網站查看詳情

Google

Gemini 2.5 Pro

總分

91

Google 在 Gemini 2.5 系列中最先進的模型，適合複雜推理與 coding 任務。

multimodalreasoninglong-context

上下文視窗

1M tokens

速度

均衡

官方網站查看詳情

Perplexity

Sonar Pro

總分

87

Perplexity 進階搜尋模型，提供更深內容理解與更高搜尋準確度。

searchresearchgrounded

上下文視窗

Search-context dependent

速度

均衡

官方網站查看詳情

精選技能

瀏覽 AI 技能與工具

真正決定模型能不能穩定落地的，通常是工具與工作流層。這裡先把那一層整理得更好讀。

Coding 與開發工具 · CLI coding agent

Codex CLI

總分

90

OpenAI 的終端優先 coding agent，可編輯程式、執行指令並進行 agent 式開發迴圈。

codingcliagent

難度

容易

來源

OpenAI docs

官方來源查看詳情

記憶與知識層 · Workspace knowledge access

Notion MCP

總分

86

Notion 官方的 MCP 整合，可把 workspace 搜尋、頁面、留言與結構化資料來源暴露給 AI client。

mcpnotionknowledge

難度

中等

來源

Notion docs

官方來源查看詳情

執行環境與沙盒 · Containerized MCP gateway

Docker MCP Gateway

總分

85

Docker 的 gateway，可在容器化且較容易治理的環境中執行並代理 MCP servers。

dockermcpgateway

難度

中等

來源

Docker docs

官方來源查看詳情

Coding 與開發工具 · Agent skill installer and discovery CLI

Vercel Skills

總分

86

Vercel 的 open skills CLI，可在多種 coding agents 之間探索、安裝與管理可重用的 agent skills。

skillscliagentskills

難度

容易

來源

Vercel docs

官方來源查看詳情

使用場景

使用場景指南

先從要完成的工作出發，再往下選最適合的模型與技能組合。

Coding 助理與 repo 執行

重點放在可靠性、diff 品質、工具呼叫控制，以及跨多檔案編修時的持續專注能力。

查看指南 →

研究整合與分析師工作流

重視來源根據、多語閱讀、長上下文推理，以及可檢視的檢索架構。

查看指南 →

agent-automation

Agent 自動化與營運流程

重視工具可靠性、可組合性、憑證安全，以及長流程中的狀態管理能力。

查看指南 →

評分方式

夠結構化，才值得參考；夠彈性，才跟得上變化。

模型分數 = 能力 30、場景適配 25、成本效率 15、速度 10、可靠性 10、Agent 就緒度 10。

技能分數 = 實用性 25、相容性 20、安裝難度 15、可靠性 15、文件品質 10、採用度 10、安全維護 5。

分數綜合 benchmark 訊號、產品體驗與編輯權重，適合拿來做實務判斷，不代表絕對真理。

給團隊與 AI 代理使用的結構化資料

從第一天起就提供乾淨、可公開使用的結構化資料。

每個端點都方便檢視、重用與索引，適合網站、內部工具、搜尋與 AI 回答引擎使用。

模型 API/data/models.json 技能 API/data/skills.json 總目錄 API/data/catalog.json