speech

작성자: openai

OpenAI Audio API를 통해 내레이션, 보이스오버, IVR 프롬프트, 접근성 읽기용 텍스트 음성 변환을 생성합니다. 단일 클립 및 배치 처리를 지원하며, 기본 모델은 gpt-4o-mini-tts-2025-12-15이고 내장 음성(cedar, marin 등)을 사용합니다. 음성 감정, 톤, 속도, 감정, 강조를 위한 명령어 증강 기능을 포함하며, 명령어는 GPT-4o mini TTS 모델에서만 지원됩니다. 요청당 4096자 입력 제한과 분당 50회 요청 속도 제한을 적용하며, 긴 텍스트는 분할 처리합니다.

npx skills add https://github.com/openai/skills --skill speech