hyperframes-media

Asset preprocessing for HyperFrames compositions — multi-provider TTS (HeyGen / ElevenLabs / Kokoro local), multi-provider BGM (Google Lyria / local MusicGen), Whisper transcription, background removal, and caption authoring. Use for npx hyperframes tts, bgm, transcribe, remove-background, voice/provider selection, music-mood prompting, captions / subtitles / lyrics / karaoke / per-word styling.

npx skills add https://github.com/heygen-com/hyperframes --skill hyperframes-media

HyperFrames Media

CLI commands that create assets (tts, bgm, transcribe, remove-background), plus everything needed to consume and animate transcript data in HTML. For placing assets into compositions, see hyperframes-core.

Provider chains (auto-detected from env)

TTSnpx hyperframes tts "..." picks the first available provider:

OrderProviderDetected whenWord timestamps
1HeyGen (Starfish)$HEYGEN_API_KEY / hyperframes auth loginYes, native — pass --words narration.words.json to capture
2ElevenLabs$ELEVENLABS_API_KEY setNo — chain transcribe after
3Kokoro-82M (local, 54 voices)always (no key required)No — chain transcribe after

If the installed hyperframes tts is the local-only build (its --help says "Kokoro-82M" and has no --provider/--words flags), it silently falls back to Kokoro even with $HEYGEN_API_KEY set. To force HeyGen regardless of CLI version, use the self-contained scripts/heygen-tts.mjs (see references/tts.md).

BGMnpx hyperframes bgm --duration N:

OrderProviderDetected when
1Google Lyria (RealTime)$GEMINI_API_KEY or $GOOGLE_API_KEY set
2MusicGen (facebook/musicgen-small, local)Python transformers + torch + soundfile installed

Override either with --provider <name>.

Routing

TaskRead
npx hyperframes tts — provider chain, voice IDs, words.jsonreferences/tts.md
HeyGen without the CLI — self-contained REST script (wav + words)scripts/heygen-tts.mjs (see references/tts.md)
npx hyperframes bgm — Lyria vs MusicGen, mood prompts, tuningreferences/bgm.md
npx hyperframes transcribe — Whisper, model rules, output shapereferences/transcribe.md
npx hyperframes remove-background — transparent cutoutsreferences/remove-background.md
TTS → transcription → captions (no recorded voiceover)references/tts-to-captions.md
Caption authoring — style detection, layout, word grouping, exitreferences/captions/authoring.md
Transcript handling — input formats, quality gates, cleanup, APIsreferences/captions/transcript-handling.md
Caption motion — karaoke, marker effects, audio-reactivereferences/captions/motion.md
Model caches, system dependencies, troubleshootingreferences/requirements.md

Non-negotiable rules

  • Voice IDs are provider-specific. am_michael is Kokoro-only; HeyGen UUIDs don't work on Kokoro. If you pass --voice, also pin --provider to avoid silent provider drift when the user's env changes.
  • Always pass --model to transcribe. The CLI default small.en silently translates non-English audio. See references/transcribe.md → "Language Rule".
  • HeyGen returns word timestamps; ElevenLabs / Kokoro do not. When you want captions, either pass --words to HeyGen and use that JSON directly, or run transcribe against the audio file. Don't assume word data is always there.
  • Captions consume the flat word-array format with { id, text, start, end }. See references/transcribe.md → "Output Shape".
  • remove-background --background-output is hole-cut, not inpainted. For "scene without the person", a different tool is needed. See references/remove-background.md → "When NOT the right tool".

Más skills de heygen-com

hyperframes-cli
heygen-com
HyperFrames CLI dev loop — `npx hyperframes` for scaffolding (init), validation (lint, inspect), preview, render, and environment troubleshooting (doctor, browser, info, upgrade). Use when running any of these commands or troubleshooting the HyperFrames build/render environment. For asset preprocessing commands (`tts`, `transcribe`, `remove-background`), invoke the `hyperframes-media` skill instead.
developmenttestingapi
hyperframes-animation
heygen-com
Todo el conocimiento de animación para HyperFrames: reglas de movimiento atómico, planos de escenas multifásicas, transiciones de escenas, técnicas más amplias de diseño de movimiento Y los siete adaptadores de tiempo de ejecución (GSAP predeterminado, más Lottie, Three.js, Anime.js, keyframes CSS, Web Animations API, TypeGPU). Úselo para cualquier tarea de movimiento o animación: elija de 2 a 4 reglas y componga, o cargue un plano, o consulte la API específica del tiempo de ejecución (por ejemplo, suavizados de GSAP / reproductor de Lottie / mezclador de Three.js). Nativo de HyperFrames: línea de tiempo única en pausa, seguro de búsqueda,...
creativedevelopmentdesign
hyperframes-core
heygen-com
HyperFrames HTML composition contract. Use for composition structure, data attributes, clips, tracks, sub-compositions, variables, media playback, deterministic render rules, and validation of minimal renderable projects.
developmentmediacreative
hyperframes-registry
heygen-com
Instalar y conectar bloques y componentes del registro en composiciones de HyperFrames. Usar al ejecutar hyperframes add, al instalar un bloque o componente, al conectar un elemento instalado en index.html, o al trabajar con hyperframes.json. Cubre el comando add, ubicaciones de instalación, conexión de subcomposiciones de bloques, fusión de fragmentos de componentes, descubrimiento del registro y creación de un nuevo bloque o componente para contribuir upstream (idea → andamiaje → validación → PR).
developmentapicode-review
general-video
heygen-com
Úsalo como respaldo para la creación de composiciones de video HTML con HyperFrames personalizadas cuando ningún flujo de trabajo especializado se ajuste. Cubre piezas largas o de múltiples escenas, reels de marca o sizzle, montajes, tarjetas de título, pósters en movimiento de larga duración, bucles estáticos y composiciones libres de cualquier duración o formato. No es para promociones de productos comercializados (product-launch-video), captura general de sitio web a video (website-to-video), explicadores de temas (faceless-explainer), videos de PR de GitHub (pr-to-video), subtitulado de material existente...
videocreativemedia
motion-graphics
heygen-com
Úsalo cuando el usuario quiera un motion graphic breve y centrado en el diseño, donde el movimiento sea el mensaje: tipografía cinética, conteo de estadísticas o números, impacto de gráfico/dato, sting de logotipo, bloque de marca, tercio inferior, llamada, superposición social, titular animado/tweet/noticia, póster en movimiento o resalte rápido de página capturada. Generalmente de menos de 10 segundos y hasta ~30 segundos, sin arco narrativo, locución ni sujeto de acción real. Puede renderizarse en MP4 o superposición transparente. No es para piezas más largas, de múltiples escenas, narradas o de reel de marca...
creativevideodesign
hyperframes-read-first
heygen-com
Comienza AQUÍ para cualquier solicitud de hacer, crear, generar, editar, animar o renderizar un video, animación, gráfico en movimiento, video explicativo, tarjeta de título, superposición, video con subtítulos, promoción de producto, video para sitio web, video de relaciones públicas o registro de cambios, montaje de datos, póster animado o composición HTML de HyperFrames. Úsalo antes que otras habilidades de video o animación cuando el usuario quiera que HyperFrames cree o renderice un video MP4/web terminado, elija un flujo de trabajo, o decida entre video de lanzamiento de producto, video explicativo sin rostro, video de sitio web a video,...
creativevideomedia
hyperframes-creative
heygen-com
Non-animation creative direction for HyperFrames videos. Use for design spec (frame.md / design.md) handling, palettes, typography, narration, beat planning, audio-reactive visuals, composition patterns, and brand / style decisions. For atomic motion patterns and scene blueprints, use `hyperframes-animation`.
creativedesignvideo