transcribe

作者: openai

將音訊檔案轉錄為文字,支援可選的說話者辨識及已知說話者提示。透過gpt-4o-mini-transcribe實現快速文字轉錄,並經由gpt-4o-transcribe-diarize提供標記說話者的辨識功能。接受多種音訊格式及可選的已知說話者參考(最多4位說話者),以提升辨識準確度。輸出格式可為純文字、JSON或含辨識標記的JSON,並可設定輸出目錄以避免覆寫。需設定OPENAI_API_KEY環境變數;使用內建...

npx skills add https://github.com/openai/skills --skill transcribe