模型

瀏覽 AI 模型

更清楚的模型目錄,方便做探索、shortlist,並直接跳到官方頁面,同時保留排名脈絡。

Discovery → shortlist → compare

不是把庫存全攤開,而是幫團隊更快縮小選項。

列表直接保留適合工作流、相容性線索、信任訊號與 compare 入口,讓目錄自然往 shortlist 與後續 routing 流程前進。

比較 shortlist

先在目錄中挑最多三個模型,再進來做並排比較。

2/3
GPT-5.4 Pro
OpenAI
Claude 3.7 Sonnet
Anthropic
比較已選模型
OpenAI

GPT-5.4 Pro

Score
93

頂級全能模型,具備出色的推理深度、穩定的程式能力,以及成熟的 agent 工具鏈支援。

適合場景
Coding · 研究 · Agent 自動化
可搭配
Codex CLI · LangGraph · MCP servers
價格
$12 / 1M tok · 均衡
最後驗證
2026年4月8日
Anthropic

Claude 3.7 Sonnet

Score
91

高信任度的推理與程式模型,寫作品質優秀,輸出穩定且一致性高。

適合場景
Coding · 研究
可搭配
Claude Code · LangGraph · Playwright
價格
$3 / 1M tok · 均衡
最後驗證
2026年4月8日
Google

Gemini 2.5 Pro

Score
90

強大的多模態模型,擅長長上下文分析、研究流程與複雜文件理解。

適合場景
研究 · Agent 自動化
可搭配
Notebook workflows · Document analysis · n8n
價格
$3.5 / 1M tok · 均衡
最後驗證
2026年4月8日
OpenAI

GPT-5 Mini

Score
87

輕量且價格友善的 OpenAI 模型,適合即時助理、分類與日常 agent 任務。

適合場景
Agent 自動化 · 研究
可搭配
n8n · Zapier AI Actions · 1Password CLI
價格
$1.1 / 1M tok · 快速
最後驗證
2026年4月8日
Google

Gemini 2.5 Flash

Score
86

低延遲多模態工作馬,適合助理介面、路由層與輕量 agent 執行。

適合場景
Agent 自動化 · 研究
可搭配
Routing layers · Multimodal inboxes · n8n
價格
$0.7 / 1M tok · 快速
最後驗證
2026年4月8日
DeepSeek

DeepSeek R1

Score
85

高性價比推理模型,在技術解題與分析深度上常有超出價格帶的表現。

適合場景
Coding · 研究
可搭配
Cost-sensitive reasoning stacks · batch analysis · fallback reasoning lanes
價格
$0.55 / 1M tok · 深思型
最後驗證
2026年4月8日
Anthropic

Claude 3.5 Haiku

Score
84

快速輕量模型,適合摘要、任務路由、客服與成本敏感型助理。

適合場景
研究 · Agent 自動化
可搭配
LangGraph · SerpApi · Slack assistants
價格
$0.8 / 1M tok · 快速
最後驗證
2026年4月8日
Alibaba Cloud

Qwen 3 Max

Score
84

具競爭力的前沿模型,在多語言尤其亞洲市場企業場景中有不錯表現。

適合場景
研究 · Agent 自動化
可搭配
multilingual support workflows · enterprise copilots · Asian-market products
價格
$2.4 / 1M tok · 均衡
最後驗證
2026年4月8日
xAI

Grok 3 Beta

Score
83

偏向即時資訊場景、推理能力持續增強,且具備新鮮網路資訊優勢的模型。

適合場景
研究
可搭配
Fresh web scans · Market monitoring · social-context workflows
價格
$5 / 1M tok · 均衡
最後驗證
2026年4月8日
Perplexity

Sonar Reasoning Pro

Score
83

偏研究導向的模型體驗,強調有根據的答案、即時網頁整合與引用友善輸出。

適合場景
研究
可搭配
citation-heavy briefs · market scans · answer-grounding workflows
價格
$2 / 1M tok · 均衡
最後驗證
2026年4月8日
Mistral

Mistral Large 2

Score
82

歐洲旗艦模型,具備紮實推理、精簡風格與靈活部署優勢。

適合場景
研究 · Coding
可搭配
EU deployment needs · internal copilots · API-first stacks
價格
$2 / 1M tok · 均衡
最後驗證
2026年4月8日
Cohere

Command A

Score
81

偏企業導向的模型,適合檢索增強、商務語言處理與穩定工作流整合。

適合場景
研究 · Agent 自動化
可搭配
RAG stacks · enterprise search · business writing workflows
價格
$2 / 1M tok · 均衡
最後驗證
2026年4月8日
Meta

Llama 4 Maverick

Score
80

彈性高的開放權重模型,社群實驗豐富,客製化潛力強。

適合場景
Agent 自動化 · 研究
可搭配
self-hosted inference · vector retrieval · custom fine-tuning
價格
Self-host / variable · 均衡
最後驗證
2026年4月8日