OpenAI

gpt-realtime-mini

面向語音與串流互動的高性價比 realtime 模型，可走 WebRTC、WebSocket 或 SIP。

總分

realtimevoicestreaming

官方網站官方文件價格加入 shortlist

上下文視窗

32K tokens

速度

快速

輸入價格

$0.60 / 1M text input tokens

輸出價格

$2.40 / 1M text output tokens

分項評分

能力79

場景適配88

成本效率89

速度98

可靠性84

Agent 就緒度87

生態90

分數綜合 benchmark 訊號、產品體驗與編輯權重，適合拿來做實務判斷，不代表絕對真理。

適合場景

Agent 自動化

可搭配

Voice agentsWebRTC appsTelephony

支援模態

textaudioimage

來源與信號

官方已驗證核心欄位

官方連結摘要說明模態模態設定上下文視窗最大輸出價格價格頁

shortlist 建議、優勢、注意事項與評分等編輯欄位，會和官方供應商資料明確分開。

OpenAI official

官方網站 · Tier 5 · 2026年4月9日

官方連結

↗

gpt-realtime-mini model docs

官方文件 · Tier 5 · 2026年4月9日

摘要說明模態模態設定上下文視窗最大輸出

↗

OpenAI API pricing

價格頁 · Tier 5 · 2026年4月9日

價格價格頁

↗

gpt-realtime-mini VerdictLens review

人工整理 · Tier 3 · 2026年4月9日

適合場景建議搭配建議優勢注意事項總分分項評分

↗

最後驗證: 2026年4月9日

優勢

低延遲音訊與文字互動是最大優勢。
當 UX 速度比長篇深度推理更重要時很有價值。

注意事項

上下文與輸出上限都小於通用前沿文字模型。
不適合作為研究型或長文件任務的預設模型。

適合場景

Agent 自動化與營運流程

重視工具可靠性、可組合性、憑證安全，以及長流程中的狀態管理能力。