GPT-5.4 Pro
頂級全能模型,具備出色的推理深度、穩定的程式能力,以及成熟的 agent 工具鏈支援。
模型
更清楚的模型目錄,方便做探索、shortlist,並直接跳到官方頁面,同時保留排名脈絡。
Discovery → shortlist → compare
列表直接保留適合工作流、相容性線索、信任訊號與 compare 入口,讓目錄自然往 shortlist 與後續 routing 流程前進。
| 名稱 | 適合場景 | 可搭配 | 價格 | 信任訊號 | 立即比較 | 查看詳情 |
|---|---|---|---|---|---|---|
GPT-5.4 Pro OpenAI Score 93 頂級全能模型,具備出色的推理深度、穩定的程式能力,以及成熟的 agent 工具鏈支援。 | Coding研究Agent 自動化 | Codex CLILangGraphMCP serversPlaywright | $12 / 1M tok $48 / 1M tok 均衡 | GPT-5.4 Pro official ↗ 最後驗證: 2026年4月8日 | 查看詳情 | |
Claude 3.7 Sonnet Anthropic Score 91 高信任度的推理與程式模型,寫作品質優秀,輸出穩定且一致性高。 | Coding研究 | Claude CodeLangGraphPlaywrightMCP servers | $3 / 1M tok $15 / 1M tok 均衡 | Claude 3.7 Sonnet official ↗ 最後驗證: 2026年4月8日 | 查看詳情 | |
Gemini 2.5 Pro Google Score 90 強大的多模態模型,擅長長上下文分析、研究流程與複雜文件理解。 | 研究Agent 自動化 | Notebook workflowsDocument analysisn8nVertex AI stacks | $3.5 / 1M tok $10.5 / 1M tok 均衡 | Gemini 2.5 Pro official ↗ 最後驗證: 2026年4月8日 | 查看詳情 | |
GPT-5 Mini OpenAI Score 87 輕量且價格友善的 OpenAI 模型,適合即時助理、分類與日常 agent 任務。 | Agent 自動化研究 | n8nZapier AI Actions1Password CLIMCP servers | $1.1 / 1M tok $4.4 / 1M tok 快速 | GPT-5 Mini official ↗ 最後驗證: 2026年4月8日 | 查看詳情 | |
Gemini 2.5 Flash Google Score 86 低延遲多模態工作馬,適合助理介面、路由層與輕量 agent 執行。 | Agent 自動化研究 | Routing layersMultimodal inboxesn8nVertex AI stacks | $0.7 / 1M tok $2.8 / 1M tok 快速 | Gemini 2.5 Flash official ↗ 最後驗證: 2026年4月8日 | 查看詳情 | |
DeepSeek R1 DeepSeek Score 85 高性價比推理模型,在技術解題與分析深度上常有超出價格帶的表現。 | Coding研究 | Cost-sensitive reasoning stacksbatch analysisfallback reasoning lanes | $0.55 / 1M tok $2.2 / 1M tok 深思型 | DeepSeek R1 official ↗ 最後驗證: 2026年4月8日 | 查看詳情 | |
Claude 3.5 Haiku Anthropic Score 84 快速輕量模型,適合摘要、任務路由、客服與成本敏感型助理。 | 研究Agent 自動化 | LangGraphSerpApiSlack assistants | $0.8 / 1M tok $4 / 1M tok 快速 | Claude 3.5 Haiku official ↗ 最後驗證: 2026年4月8日 | 查看詳情 | |
Qwen 3 Max Alibaba Cloud Score 84 具競爭力的前沿模型,在多語言尤其亞洲市場企業場景中有不錯表現。 | 研究Agent 自動化 | multilingual support workflowsenterprise copilotsAsian-market products | $2.4 / 1M tok $9 / 1M tok 均衡 | Qwen 3 Max official ↗ 最後驗證: 2026年4月8日 | 查看詳情 | |
Grok 3 Beta xAI Score 83 偏向即時資訊場景、推理能力持續增強,且具備新鮮網路資訊優勢的模型。 | 研究 | Fresh web scansMarket monitoringsocial-context workflows | $5 / 1M tok $15 / 1M tok 均衡 | Grok 3 Beta official ↗ 最後驗證: 2026年4月8日 | 查看詳情 | |
Sonar Reasoning Pro Perplexity Score 83 偏研究導向的模型體驗,強調有根據的答案、即時網頁整合與引用友善輸出。 | 研究 | citation-heavy briefsmarket scansanswer-grounding workflows | $2 / 1M tok $8 / 1M tok 均衡 | Sonar Reasoning Pro official ↗ 最後驗證: 2026年4月8日 | 查看詳情 | |
Mistral Large 2 Mistral Score 82 歐洲旗艦模型,具備紮實推理、精簡風格與靈活部署優勢。 | 研究Coding | EU deployment needsinternal copilotsAPI-first stacks | $2 / 1M tok $6 / 1M tok 均衡 | Mistral Large 2 official ↗ 最後驗證: 2026年4月8日 | 查看詳情 | |
Command A Cohere Score 81 偏企業導向的模型,適合檢索增強、商務語言處理與穩定工作流整合。 | 研究Agent 自動化 | RAG stacksenterprise searchbusiness writing workflows | $2 / 1M tok $8 / 1M tok 均衡 | Command A official ↗ 最後驗證: 2026年4月8日 | 查看詳情 | |
Llama 4 Maverick Meta Score 80 彈性高的開放權重模型,社群實驗豐富,客製化潛力強。 | Agent 自動化研究 | self-hosted inferencevector retrievalcustom fine-tuning | Self-host / variable Self-host / variable 均衡 | Llama 4 Maverick official ↗ 最後驗證: 2026年4月8日 | 查看詳情 |
頂級全能模型,具備出色的推理深度、穩定的程式能力,以及成熟的 agent 工具鏈支援。
高信任度的推理與程式模型,寫作品質優秀,輸出穩定且一致性高。
強大的多模態模型,擅長長上下文分析、研究流程與複雜文件理解。
輕量且價格友善的 OpenAI 模型,適合即時助理、分類與日常 agent 任務。
低延遲多模態工作馬,適合助理介面、路由層與輕量 agent 執行。
高性價比推理模型,在技術解題與分析深度上常有超出價格帶的表現。
快速輕量模型,適合摘要、任務路由、客服與成本敏感型助理。
具競爭力的前沿模型,在多語言尤其亞洲市場企業場景中有不錯表現。
偏向即時資訊場景、推理能力持續增強,且具備新鮮網路資訊優勢的模型。
偏研究導向的模型體驗,強調有根據的答案、即時網頁整合與引用友善輸出。
歐洲旗艦模型,具備紮實推理、精簡風格與靈活部署優勢。
偏企業導向的模型,適合檢索增強、商務語言處理與穩定工作流整合。
彈性高的開放權重模型,社群實驗豐富,客製化潛力強。