← 返回技能列表
Speech to text · extraction
OpenAI Whisper
成熟穩定的語音轉文字層,適合會議、Podcast、多語筆記與語音工作流。
總分
87
audiotranscriptionmultilingual
設定難度
容易
安裝方式
pip · local
支援供應商
OpenAI · Local runtime
支援載體
CLI · Python apps · local pipelines
權限姿態
low
最後驗證
2026年4月8日
分項評分
實用性87
相容性89
安裝難度94
可靠性91
文件品質84
採用度92
安全維護82
分數綜合 benchmark 訊號、產品體驗與編輯權重,適合拿來做實務判斷,不代表絕對真理。
適合場景
researchagent-automation
可搭配
audio pipelinesmeeting noteslocal transcription stacks
能力
speech-to-textmultilingual transcriptionbatch audio processing
優勢
- 依然是最可靠的轉錄基礎元件之一
- 可同時用於本地與 API 型流程
注意事項
- 它本身不是完整音訊 intelligence stack
- 要做漂亮摘要仍需後處理