hyperframes-media

Pré-processamento de assets para composições HyperFrames — TTS multi-provedor (HeyGen / ElevenLabs / Kokoro local), BGM multi-provedor (Google Lyria / MusicGen local), transcrição Whisper, remoção de fundo e criação de legendas. Use para npx hyperframes tts, bgm, transcribe, remove-background, seleção de voz/provedor, sugestão de clima musical, legendas / subtítulos / letras / karaokê / estilo por palavra.

npx skills add https://github.com/heygen-com/hyperframes --skill hyperframes-media

HyperFrames Media

CLI commands that create assets (tts, bgm, transcribe, remove-background), plus everything needed to consume and animate transcript data in HTML. For placing assets into compositions, see hyperframes-core.

Provider chains (auto-detected from env)

TTSnpx hyperframes tts "..." picks the first available provider:

OrderProviderDetected whenWord timestamps
1HeyGen (Starfish)$HEYGEN_API_KEY / hyperframes auth loginYes, native — pass --words narration.words.json to capture
2ElevenLabs$ELEVENLABS_API_KEY setNo — chain transcribe after
3Kokoro-82M (local, 54 voices)always (no key required)No — chain transcribe after

If the installed hyperframes tts is the local-only build (its --help says "Kokoro-82M" and has no --provider/--words flags), it silently falls back to Kokoro even with $HEYGEN_API_KEY set. To force HeyGen regardless of CLI version, use the self-contained scripts/heygen-tts.mjs (see references/tts.md).

BGMnpx hyperframes bgm --duration N:

OrderProviderDetected when
1Google Lyria (RealTime)$GEMINI_API_KEY or $GOOGLE_API_KEY set
2MusicGen (facebook/musicgen-small, local)Python transformers + torch + soundfile installed

Override either with --provider <name>.

Routing

TaskRead
npx hyperframes tts — provider chain, voice IDs, words.jsonreferences/tts.md
HeyGen without the CLI — self-contained REST script (wav + words)scripts/heygen-tts.mjs (see references/tts.md)
npx hyperframes bgm — Lyria vs MusicGen, mood prompts, tuningreferences/bgm.md
npx hyperframes transcribe — Whisper, model rules, output shapereferences/transcribe.md
npx hyperframes remove-background — transparent cutoutsreferences/remove-background.md
TTS → transcription → captions (no recorded voiceover)references/tts-to-captions.md
Caption authoring — style detection, layout, word grouping, exitreferences/captions/authoring.md
Transcript handling — input formats, quality gates, cleanup, APIsreferences/captions/transcript-handling.md
Caption motion — karaoke, marker effects, audio-reactivereferences/captions/motion.md
Model caches, system dependencies, troubleshootingreferences/requirements.md

Non-negotiable rules

  • Voice IDs are provider-specific. am_michael is Kokoro-only; HeyGen UUIDs don't work on Kokoro. If you pass --voice, also pin --provider to avoid silent provider drift when the user's env changes.
  • Always pass --model to transcribe. The CLI default small.en silently translates non-English audio. See references/transcribe.md → "Language Rule".
  • HeyGen returns word timestamps; ElevenLabs / Kokoro do not. When you want captions, either pass --words to HeyGen and use that JSON directly, or run transcribe against the audio file. Don't assume word data is always there.
  • Captions consume the flat word-array format with { id, text, start, end }. See references/transcribe.md → "Output Shape".
  • remove-background --background-output is hole-cut, not inpainted. For "scene without the person", a different tool is needed. See references/remove-background.md → "When NOT the right tool".

Mais skills de heygen-com

hyperframes-cli
heygen-com
HyperFrames CLI dev loop — `npx hyperframes` for scaffolding (init), validation (lint, inspect), preview, render, and environment troubleshooting (doctor, browser, info, upgrade). Use when running any of these commands or troubleshooting the HyperFrames build/render environment. For asset preprocessing commands (`tts`, `transcribe`, `remove-background`), invoke the `hyperframes-media` skill instead.
developmenttestingapi
hyperframes-animation
heygen-com
Todo conhecimento de animação para HyperFrames — regras de movimento atômico, blueprints de cena multifásica, transições de cena, técnicas mais amplas de design de movimento, E os sete adaptadores de runtime (GSAP padrão, mais Lottie, Three.js, Anime.js, keyframes CSS, Web Animations API, TypeGPU). Use para qualquer tarefa de movimento ou animação: escolha 2-4 regras e componha, ou carregue um blueprint, ou consulte a API específica do runtime (ex.: eases do GSAP / player Lottie / mixer Three.js). Nativo do HyperFrames: timeline única pausada, seguro para busca,...
creativedevelopmentdesign
hyperframes-core
heygen-com
Contrato de composição HTML do HyperFrames. Use para estrutura de composição, atributos de dados, clipes, faixas, subcomposições, variáveis, reprodução de mídia, regras de renderização determinísticas e validação de projetos mínimos renderizáveis.
developmentmediacreative
hyperframes-registry
heygen-com
Instale e conecte blocos e componentes do registry em composições HyperFrames. Use ao executar hyperframes add, instalar um bloco ou componente, conectar um item instalado no index.html ou trabalhar com hyperframes.json. Abrange o comando add, locais de instalação, conexão de subcomposição de blocos, mesclagem de snippets de componentes, descoberta do registry e criação de um novo bloco ou componente para contribuir upstream (ideia → scaffold → validar → PR).
developmentapicode-review
general-video
heygen-com
Use como fallback para a criação de composições de vídeo HTML com HyperFrames personalizadas quando nenhum fluxo de trabalho especializado se adequar. Abrange peças mais longas ou com múltiplas cenas, reels de marca/sizzle, montagens, cartelas de título, motion posters de longa duração, loops estáticos e composições livres em qualquer duração ou formato. Não é para promoções de produtos comercializados (product-launch-video), captura geral de site para vídeo (website-to-video), explicadores de tópicos (faceless-explainer), vídeos de PR do GitHub (pr-to-video), legendagem de filmagens existentes...
videocreativemedia
motion-graphics
heygen-com
Use quando o usuário deseja um motion graphic curto e focado em design, onde o movimento é a mensagem: tipografia cinética, contagem de estatísticas ou números, destaque de gráfico/visualização de dados, vinheta de logotipo, composição de marca, terço inferior, chamada, sobreposição para redes sociais, manchete/tweet/notícia animada, pôster animado ou destaque rápido de página capturada. Geralmente com menos de 10s e até ~30s, sem arco narrativo, locução ou cena com atores reais. Pode ser renderizado em MP4 ou sobreposição transparente. Não indicado para peças mais longas, com múltiplas cenas, narradas ou do tipo reel de marca...
creativevideodesign
hyperframes-read-first
heygen-com
Comece AQUI para qualquer solicitação de fazer, criar, gerar, editar, animar ou renderizar um vídeo, animação, motion graphic, vídeo explicativo, cartão de título, sobreposição, vídeo com legendas, promoção de produto, vídeo para site, vídeo de PR ou changelog, montagem de dados, pôster animado ou composição HTML do HyperFrames. Use antes de outras habilidades de vídeo ou animação quando o usuário quiser que o HyperFrames crie ou renderize um vídeo MP4/web finalizado, escolha um fluxo de trabalho ou direcione entre vídeo de lançamento de produto, explicador sem rosto, site para vídeo,...
creativevideomedia
hyperframes-creative
heygen-com
Non-animation creative direction for HyperFrames videos. Use for design spec (frame.md / design.md) handling, palettes, typography, narration, beat planning, audio-reactive visuals, composition patterns, and brand / style decisions. For atomic motion patterns and scene blueprints, use `hyperframes-animation`.
creativedesignvideo