hyperframes-media

Asset-Vorverarbeitung für HyperFrames-Kompositionen — Multi-Provider TTS (HeyGen / ElevenLabs / Kokoro lokal), Multi-Provider BGM (Google Lyria / lokales MusicGen), Whisper-Transkription, Hintergrundentfernung und Untertitel-Erstellung. Verwendung für npx hyperframes tts, bgm, transcribe, remove-background, voice/provider-Auswahl, music-mood-Prompting, captions / subtitles / lyrics / karaoke / per-word-styling.

npx skills add https://github.com/heygen-com/hyperframes --skill hyperframes-media

HyperFrames Media

CLI commands that create assets (tts, bgm, transcribe, remove-background), plus everything needed to consume and animate transcript data in HTML. For placing assets into compositions, see hyperframes-core.

Provider chains (auto-detected from env)

TTSnpx hyperframes tts "..." picks the first available provider:

OrderProviderDetected whenWord timestamps
1HeyGen (Starfish)$HEYGEN_API_KEY / hyperframes auth loginYes, native — pass --words narration.words.json to capture
2ElevenLabs$ELEVENLABS_API_KEY setNo — chain transcribe after
3Kokoro-82M (local, 54 voices)always (no key required)No — chain transcribe after

If the installed hyperframes tts is the local-only build (its --help says "Kokoro-82M" and has no --provider/--words flags), it silently falls back to Kokoro even with $HEYGEN_API_KEY set. To force HeyGen regardless of CLI version, use the self-contained scripts/heygen-tts.mjs (see references/tts.md).

BGMnpx hyperframes bgm --duration N:

OrderProviderDetected when
1Google Lyria (RealTime)$GEMINI_API_KEY or $GOOGLE_API_KEY set
2MusicGen (facebook/musicgen-small, local)Python transformers + torch + soundfile installed

Override either with --provider <name>.

Routing

TaskRead
npx hyperframes tts — provider chain, voice IDs, words.jsonreferences/tts.md
HeyGen without the CLI — self-contained REST script (wav + words)scripts/heygen-tts.mjs (see references/tts.md)
npx hyperframes bgm — Lyria vs MusicGen, mood prompts, tuningreferences/bgm.md
npx hyperframes transcribe — Whisper, model rules, output shapereferences/transcribe.md
npx hyperframes remove-background — transparent cutoutsreferences/remove-background.md
TTS → transcription → captions (no recorded voiceover)references/tts-to-captions.md
Caption authoring — style detection, layout, word grouping, exitreferences/captions/authoring.md
Transcript handling — input formats, quality gates, cleanup, APIsreferences/captions/transcript-handling.md
Caption motion — karaoke, marker effects, audio-reactivereferences/captions/motion.md
Model caches, system dependencies, troubleshootingreferences/requirements.md

Non-negotiable rules

  • Voice IDs are provider-specific. am_michael is Kokoro-only; HeyGen UUIDs don't work on Kokoro. If you pass --voice, also pin --provider to avoid silent provider drift when the user's env changes.
  • Always pass --model to transcribe. The CLI default small.en silently translates non-English audio. See references/transcribe.md → "Language Rule".
  • HeyGen returns word timestamps; ElevenLabs / Kokoro do not. When you want captions, either pass --words to HeyGen and use that JSON directly, or run transcribe against the audio file. Don't assume word data is always there.
  • Captions consume the flat word-array format with { id, text, start, end }. See references/transcribe.md → "Output Shape".
  • remove-background --background-output is hole-cut, not inpainted. For "scene without the person", a different tool is needed. See references/remove-background.md → "When NOT the right tool".

Mehr Skills von heygen-com

hyperframes-cli
heygen-com
HyperFrames CLI dev loop — `npx hyperframes` for scaffolding (init), validation (lint, inspect), preview, render, and environment troubleshooting (doctor, browser, info, upgrade). Use when running any of these commands or troubleshooting the HyperFrames build/render environment. For asset preprocessing commands (`tts`, `transcribe`, `remove-background`), invoke the `hyperframes-media` skill instead.
developmenttestingapi
hyperframes-animation
heygen-com
Sämtliches Animationswissen für HyperFrames – atomare Bewegungsregeln, mehrphasige Szenenbaupläne, Szenenübergänge, umfassendere Motion-Design-Techniken UND die sieben Laufzeitadapter (GSAP-Standard, plus Lottie, Three.js, Anime.js, CSS-Keyframes, Web Animations API, TypeGPU). Für jede Bewegungs- oder Animationsaufgabe verwendbar: 2-4 Regeln auswählen und kombinieren, einen Bauplan laden oder laufzeitspezifische API nachschlagen (z. B. GSAP-Easing / Lottie-Player / Three.js-Mixer). HyperFrames-nativ: einzelne pausierte Timeline, suchsicher,...
creativedevelopmentdesign
hyperframes-core
heygen-com
HyperFrames HTML-Kompositionsvertrag. Verwendung für Kompositionsstruktur, Datenattribute, Clips, Tracks, Unterkompositionen, Variablen, Medienwiedergabe, deterministische Renderregeln und Validierung minimal renderbarer Projekte.
developmentmediacreative
hyperframes-registry
heygen-com
Installieren und einbinden von Registry-Blöcken und -Komponenten in HyperFrames-Kompositionen. Verwenden beim Ausführen von hyperframes add, Installieren eines Blocks oder einer Komponente, Einbinden eines installierten Elements in index.html oder Arbeiten mit hyperframes.json. Umfasst den add-Befehl, Installationsorte, Einbindung von Block-Unterkompositionen, Zusammenführung von Komponenten-Snippets, Registry-Erkennung und Erstellung eines neuen Blocks oder einer neuen Komponente für einen Upstream-Beitrag (Idee → Gerüst → Validierung → PR).
developmentapicode-review
general-video
heygen-com
Wird als Fallback für die Erstellung benutzerdefinierter HyperFrames-HTML-Videokompositionen verwendet, wenn kein spezialisierter Workflow passt. Deckt längere oder mehrszenige Stücke, Brand-/Sizzle-Reels, Montagen, Titelcards, Motion-Poster in voller Länge, statische Loops und freie Kompositionen jeder Länge oder jedes Formats ab. Nicht für vermarktete Produkt-Promos (product-launch-video), allgemeine Website-zu-Video-Aufnahmen (website-to-video), thematische Erklärvideos (faceless-explainer), GitHub-PR-Videos (pr-to-video), Untertitelung vorhandenen Filmmaterials...
videocreativemedia
motion-graphics
heygen-com
Verwenden, wenn der Benutzer ein kurzes, designorientiertes Bewegtbild wünscht, bei dem die Bewegung die Botschaft ist: kinetische Typografie, Statistik- oder Zahlen-Count-up, Chart-/Datenvisualisierungs-Effekt, Logo-Sting, Brand-Lockup, Lower-Third, Callout, Social-Overlay, animierte Schlagzeile/Tweet/News-Element, Motion-Poster oder kurze hervorgehobene Seitenaufnahme. Meist unter 10 s und bis zu ~30 s, ohne Erzählbogen, Voice-Over oder Live-Action-Subjekt. Kann als MP4 oder transparentes Overlay ausgegeben werden. Nicht für längere, mehrszenige, erzählte oder Brand-Reel-Stücke...
creativevideodesign
hyperframes-read-first
heygen-com
Beginne hier bei jeder Anfrage zum Erstellen, Generieren, Bearbeiten, Animieren oder Rendern eines Videos, einer Animation, eines Bewegtgrafiks, eines Erklärvideos, einer Titelgrafik, einer Einblendung, eines Videos mit Untertiteln, eines Produktwerbevideos, eines Website-Videos, eines PR- oder Changelog-Videos, einer Datenmontage, eines Bewegtposters oder einer HyperFrames HTML-Komposition. Vor anderen Video- oder Animationsfähigkeiten verwenden, wenn der Benutzer wünscht, dass HyperFrames ein fertiges MP4/Web-Video erstellt oder rendert, einen Workflow auswählt oder zwischen Produkt-Launch-Video, gesichtslosem Erklärvideo, Website-zu-Video,... weiterleitet.
creativevideomedia
hyperframes-creative
heygen-com
Non-animation creative direction for HyperFrames videos. Use for design spec (frame.md / design.md) handling, palettes, typography, narration, beat planning, audio-reactive visuals, composition patterns, and brand / style decisions. For atomic motion patterns and scene blueprints, use `hyperframes-animation`.
creativedesignvideo