transcribe

tarafından openai

Ses dosyalarını, isteğe bağlı konuşmacı ayırma ve bilinen konuşmacı ipuçlarıyla metne dönüştürür. gpt-4o-mini-transcribe ile hızlı metin transkripsiyonunu ve gpt-4o-transcribe-diarize ile konuşmacı etiketli ayırmayı destekler. Birden fazla ses formatını ve ayırma doğruluğunu artırmak için isteğe bağlı bilinen konuşmacı referanslarını (en fazla 4 konuşmacı) kabul eder. Çıktıyı düz metin, JSON veya ayırmalı JSON olarak, üzerine yazmayı önlemek için yapılandırılabilir çıktı dizinleriyle sunar. OPENAI_API_KEY ortam değişkenini gerektir

npx skills add https://github.com/openai/skills --skill transcribe