ai-avatar-video

bởi doany-ai

Create AI avatar, talking-head, and lip-sync videos on RunComfy via the `runcomfy` CLI. Routes across ByteDance OmniHuman (audio-driven full-body avatar), Wan-AI Wan 2-7 (audio-driven mouth sync via `audio_url` on a portrait), HappyHorse 1.0 (Arena #1 t2v / i2v with in-pass audio), and Seedance v2 Pro (multi-modal cinematic with reference audio + reference subject). Picks the right model for the user's actual intent — UGC voiceover, virtual presenter, dubbed product demo, lip-synced...

npx skills add https://github.com/doany-ai/skills --skill ai-avatar-video

Thêm skills từ doany-ai

image-edit
doany-ai
Chỉnh sửa hình ảnh trên RunComfy — kỹ năng này là bộ định tuyến thông minh, khớp ý định của người dùng với mô hình chỉnh sửa phù hợp trong danh mục RunComfy. Chọn Nano Banana Edit (xử lý hàng loạt tối đa 20 ảnh, mặc định giữ nguyên nhận dạng), OpenAI GPT Image 2 Edit (viết lại văn bản trong ảnh đa ngôn ngữ, kết hợp nhiều tham chiếu, bố cục chính xác), Flux Kontext Pro (chỉnh sửa cục bộ độ trung thực cao với một tham chiếu), hoặc Z-Image Turbo Inpaint (chỉnh sửa vùng chính xác dựa trên mặt nạ). Tổng hợp các mẫu gợi ý đã
creativeimagemedia
seedance-v2
doany-ai
Generate cinematic short-form video with ByteDance Seedance 2.0 Pro on RunComfy. Documents Seedance 2.0 Pro's strengths (multi-modal references — up to 9 images, 3 videos, 3 audio — synchronized in-pass audio with natural lip-sync, cinematic motion refinement), the 4–15s duration schema, and when to route to HappyHorse 1.0 / Wan 2.7 / Kling instead. Calls `runcomfy run bytedance/seedance-v2/pro` through the local RunComfy CLI. Triggers on "seedance", "seedance 2", "seedance v2", "seedance...
videocreativemedia
kling-3-0
doany-ai
Tạo video Kling 3.0 trên RunComfy. Kling 3.0 (còn gọi là Kling V3.0) là mô hình video đa cảnh thế hệ thứ ba của Kuaishou Technology, có âm thanh đồng bộ gốc và nhận diện nhân vật nhất quán giữa các cảnh. Kỹ năng này bao gồm tất cả sáu điểm cuối của Kling 3.0, trải dài ba cấp độ kết xuất (Standard, Pro, 4K) và hai chế độ (văn bản thành video, hình ảnh thành video). Gọi runcomfy run kling/kling-3.0/ / thông qua CLI RunComfy cục bộ. Kích hoạt bằng "kling", "kling 3.0", "kling v3", "kling pro",...
videocreativemedia
face-swap
doany-ai
Swap a face / character into video or images on RunComfy via the `runcomfy` CLI. Routes across community Wan 2-2 Animate (audio-driven character animation + identity swap), GPT Image 2 Edit (single-shot precise face swap on still images via reference composition), Nano Banana Edit (batch identity-preserving swap), Flux Kontext (single-ref high-fidelity local face edit), and Kling 2-6 Motion Control Pro (transfer motion from one performance onto a target character). Picks the right model for...
creativevideoimage
video-outpainting
doany-ai
Video outpainting on RunComfy via the `runcomfy` CLI — extend the spatial canvas of a video, change aspect ratio (9:16 vertical to 16:9 horizontal or vice versa), add environment beyond the original frame while preserving the central action. Routes prompt-shaped spatial extension through Wan 2-7 edit-video and points the agent at dedicated ComfyUI outpaint workflows when seam quality matters for hero delivery. Triggers on "video outpaint", "video outpainting", "extend video canvas", "expand...
videocreativemedia
flux-kontext
doany-ai
Chỉnh sửa hình ảnh với Flux 1 Kontext Pro (mô hình chỉnh sửa cục bộ chính xác của Black Forest Labs) trên RunComfy — được tích hợp sẵn các mẫu prompt đã được ghi chép của mô hình, giúp kỹ năng đạt đầu ra sắc nét hơn so với việc dùng prompt thô trên cùng mô hình. Ghi lại điểm mạnh của Flux Kontext (chỉnh sửa cục bộ chính xác từ một tham chiếu, kiểm soát prompt mạnh mẽ, đầu ra chất lượng cao nhất quán), lược đồ (một hình ảnh + prompt), và thời điểm chuyển hướng sang Nano Banana Edit / GPT Image 2 edit / Flux 2 Klein. Gọi...
creativeimagedocument
image-outpainting
doany-ai
Image outpainting on RunComfy via the `runcomfy` CLI — extend a still beyond its original canvas, fill in what the camera didn't capture, change aspect ratio (square → 16:9, portrait → landscape) while preserving the original content. Routes across Nano Banana 2 Edit (default, spatial-language driven), GPT Image 2 Edit (multi-ref with reference-style matching), FLUX Kontext Pro (single-shot maximum-preservation), and the brand edit endpoints (Seedream / Dreamina / Qwen / FLUX 2). Picks the...
creativeimagemedia
relight
doany-ai
Relight a still image — change the lighting setup, color temperature, direction, or mood — on RunComfy via the `runcomfy` CLI. Routes to Qwen Edit 2509's dedicated `relight` LoRA endpoint for purpose-built relighting, with fallback to identity-preserving edit endpoints (Nano Banana 2 Edit, GPT Image 2 Edit, FLUX Kontext Pro) when prose lighting language is enough. Use for product relighting (studio softbox → window light), portrait mood shift (overcast → golden hour), or color-grade change....
creativeimagemedia