返回模型列表
OpenAI logo

OpenAI

gpt-realtime-mini

面向語音與串流互動的高性價比 realtime 模型,可走 WebRTC、WebSocket 或 SIP。

總分
84
realtimevoicestreaming
上下文視窗
32K tokens
速度
快速
輸入價格
$0.60 / 1M text input tokens
輸出價格
$2.40 / 1M text output tokens

分項評分

能力79
場景適配88
成本效率89
速度98
可靠性84
Agent 就緒度87
生態90

分數綜合 benchmark 訊號、產品體驗與編輯權重,適合拿來做實務判斷,不代表絕對真理。

適合場景

Agent 自動化

可搭配

Voice agentsWebRTC appsTelephony

支援模態

textaudioimage

優勢

  • 低延遲音訊與文字互動是最大優勢。
  • 當 UX 速度比長篇深度推理更重要時很有價值。

注意事項

  • 上下文與輸出上限都小於通用前沿文字模型。
  • 不適合作為研究型或長文件任務的預設模型。

適合場景