transcribe

bởi openai

Chuyển đổi tệp âm thanh thành văn bản với tùy chọn phân biệt người nói và gợi ý người nói đã biết. Hỗ trợ chuyển đổi văn bản nhanh qua gpt-4o-mini-transcribe và phân biệt người nói có nhãn qua gpt-4o-transcribe-diarize. Chấp nhận nhiều định dạng âm thanh và tham chiếu người nói đã biết tùy chọn (tối đa 4 người nói) để cải thiện độ chính xác phân biệt. Xuất ra dưới dạng văn bản thuần, JSON, hoặc JSON có phân biệt với thư mục đầu ra có thể cấu hình để tránh ghi đè. Yêu cầu biến môi trường OPENAI_API_KEY; s

npx skills add https://github.com/openai/skills --skill transcribe