soundside.ai MCP Server
oficialGeneración de medios nativa de MCP con pago por llamada x402. Imagen, video, audio y música de 6 proveedores, componibles mediante IDs de recurso. USDC en Base.
Documentación
Soundside — Documentación para Desarrolladores
Plataforma de Producción de Medios con IA para Agentes
Soundside expone 19 herramientas MCP para generar, editar, componer, extraer y analizar medios — imágenes, video, audio, música, texto y artefactos empresariales — además del ajuste fino de adaptadores LoRA y composición de video del lado del servidor. Conecta cualquier cliente MCP. Paga con una clave API (créditos) o cripto (USDC x402 en Base, sin necesidad de cuenta).
Inicio Rápido
# MCP endpoint
https://mcp.soundside.ai/mcp
# Auth: API key or x402 crypto payment
Authorization: Bearer <your-api-key>
POST https://mcp.soundside.ai/mcp
{"jsonrpc":"2.0","id":"1","method":"tools/list","params":{}}
Herramientas (19)
Generación
| Herramienta | Qué Hace | Proveedores |
|---|---|---|
create_image | Texto a imagen, referencias de personajes | Alibaba (Wan), Grok, Luma, MiniMax, Runway, Vertex AI |
create_video | Texto a video, imagen a video, extensión de video | Alibaba (Wan), Grok, Luma, MiniMax, Runway, Vertex AI (Veo 3.1) |
create_audio | TTS, efectos de sonido, clonación de voz, diseño de voz | MiniMax, Runway, Vertex AI |
create_music | Música a partir de letras y estilos | MiniMax |
create_text | Completaciones de chat LLM, salida estructurada | Grok, MiniMax, Vertex AI (Gemini) |
create_artifact | Gráficos, presentaciones, documentos, diagramas; modo paquete para artefactos múltiples | plotly, pptx, docx, weasyprint, mermaid, gamma |
Composición
| Herramienta | Qué Hace |
|---|---|
compose_video | Pipeline del lado del servidor: enriquece el plan, genera activos en paralelo, ensambla con transiciones, atenuación de audio y superposiciones |
Edición
| Herramienta | Qué Hace |
|---|---|
edit_video | Transformaciones de video esenciales: recortar, concatenar, fundido cruzado, velocidad, bucle, etalonaje, incrustar subtítulos, FFmpeg personalizado |
edit_audio | Mezclar, reemplazar o rellenar audio en medios existentes |
compose_media | Añadir texto, superponer medios o crear composiciones de pantalla dividida |
apply_effect | Ken Burns, rampa de velocidad, grano de película, viñeta |
extract_media | Extraer fotogramas, conjuntos de fotogramas o pistas de audio |
Análisis
| Herramienta | Qué Hace | Proveedores |
|---|---|---|
analyze_media | Metadatos técnicos, QA visual, transcripción, detección de segmentos, exportación EDL | Anthropic, Grok, OpenAI, Qwen, Vertex (+ soundside.ai ffprobe) |
Adaptadores (LoRA)
| Herramienta | Qué Hace | Backends |
|---|---|---|
train_adapter | Entrenar un adaptador LoRA desde medios de la biblioteca | DashScope (Wan), Modal (Hunyuan/LTX) |
list_adapters | Listar tus adaptadores LoRA | |
manage_adapter | Inspeccionar, desplegar, retirar, eliminar o seleccionar punto de control |
Gestión de Biblioteca
| Herramienta | Qué Hace |
|---|---|
lib_list | Explorar proyectos, colecciones, recursos, linaje, kits de marca; consultar saldo de créditos |
lib_manage | CRUD para proyectos, colecciones, recursos, kits de marca |
lib_share | Compartir proyectos con otros usuarios por correo electrónico |
Precios
Soundside busca cubrir los costos de transferencia del proveedor con un pequeño margen (~10%). El motor de edición y la biblioteca tienen un precio de $0.01/llamada; QA visual cuesta $0.03.
Los precios en vivo siempre están disponibles en:
GET https://mcp.soundside.ai/api/x402/status
Esto devuelve precios en USDC legibles por máquina por herramienta y por proveedor. Los precios se gestionan en base de datos y pueden cambiar — siempre consulta el endpoint en lugar de codificarlos.
x402: Pago por Llamada con Cripto
No se necesita clave API. Paga con USDC en Base (L2) por llamada de herramienta mediante EIP-3009 transferWithAuthorization (firma fuera de cadena, el facilitador paga el gas).
Network: eip155:8453 (Base mainnet)
Token: USDC
Facilitator: Coinbase CDP
Consulta la Guía x402 para la configuración completa.
Guías
- Primeros Pasos — Primera conexión MCP en 5 minutos
- x402 Pago por Llamada — Pagos con cripto, sin necesidad de cuenta
- Referencia de Herramientas — Documentación detallada de las 19 herramientas
Ejemplos
- Python — Clave API — Conectar y generar con httpx
- Python — x402 — Pago por llamada con USDC
- TypeScript — Clave API — Cliente MCP para Node.js
- Habilidad OpenClaw — Configuración de una línea para agentes OpenClaw
Enlaces
- Sitio Web: soundside.ai
- Endpoint MCP:
https://mcp.soundside.ai/mcp - Precios en Vivo:
https://mcp.soundside.ai/api/x402/status - GitHub: github.com/soundside-design/soundside-docs