soundside.ai MCP Server

oficial

Generación de medios nativa de MCP con pago por llamada x402. Imagen, video, audio y música de 6 proveedores, componibles mediante IDs de recurso. USDC en Base.

Documentación

Soundside — Documentación para Desarrolladores

Plataforma de Producción de Medios con IA para Agentes

Soundside expone 19 herramientas MCP para generar, editar, componer, extraer y analizar medios — imágenes, video, audio, música, texto y artefactos empresariales — además del ajuste fino de adaptadores LoRA y composición de video del lado del servidor. Conecta cualquier cliente MCP. Paga con una clave API (créditos) o cripto (USDC x402 en Base, sin necesidad de cuenta).

Inicio Rápido

# MCP endpoint
https://mcp.soundside.ai/mcp

# Auth: API key or x402 crypto payment
Authorization: Bearer <your-api-key>
POST https://mcp.soundside.ai/mcp
{"jsonrpc":"2.0","id":"1","method":"tools/list","params":{}}

Herramientas (19)

Generación

HerramientaQué HaceProveedores
create_imageTexto a imagen, referencias de personajesAlibaba (Wan), Grok, Luma, MiniMax, Runway, Vertex AI
create_videoTexto a video, imagen a video, extensión de videoAlibaba (Wan), Grok, Luma, MiniMax, Runway, Vertex AI (Veo 3.1)
create_audioTTS, efectos de sonido, clonación de voz, diseño de vozMiniMax, Runway, Vertex AI
create_musicMúsica a partir de letras y estilosMiniMax
create_textCompletaciones de chat LLM, salida estructuradaGrok, MiniMax, Vertex AI (Gemini)
create_artifactGráficos, presentaciones, documentos, diagramas; modo paquete para artefactos múltiplesplotly, pptx, docx, weasyprint, mermaid, gamma

Composición

HerramientaQué Hace
compose_videoPipeline del lado del servidor: enriquece el plan, genera activos en paralelo, ensambla con transiciones, atenuación de audio y superposiciones

Edición

HerramientaQué Hace
edit_videoTransformaciones de video esenciales: recortar, concatenar, fundido cruzado, velocidad, bucle, etalonaje, incrustar subtítulos, FFmpeg personalizado
edit_audioMezclar, reemplazar o rellenar audio en medios existentes
compose_mediaAñadir texto, superponer medios o crear composiciones de pantalla dividida
apply_effectKen Burns, rampa de velocidad, grano de película, viñeta
extract_mediaExtraer fotogramas, conjuntos de fotogramas o pistas de audio

Análisis

HerramientaQué HaceProveedores
analyze_mediaMetadatos técnicos, QA visual, transcripción, detección de segmentos, exportación EDLAnthropic, Grok, OpenAI, Qwen, Vertex (+ soundside.ai ffprobe)

Adaptadores (LoRA)

HerramientaQué HaceBackends
train_adapterEntrenar un adaptador LoRA desde medios de la bibliotecaDashScope (Wan), Modal (Hunyuan/LTX)
list_adaptersListar tus adaptadores LoRA
manage_adapterInspeccionar, desplegar, retirar, eliminar o seleccionar punto de control

Gestión de Biblioteca

HerramientaQué Hace
lib_listExplorar proyectos, colecciones, recursos, linaje, kits de marca; consultar saldo de créditos
lib_manageCRUD para proyectos, colecciones, recursos, kits de marca
lib_shareCompartir proyectos con otros usuarios por correo electrónico

Precios

Soundside busca cubrir los costos de transferencia del proveedor con un pequeño margen (~10%). El motor de edición y la biblioteca tienen un precio de $0.01/llamada; QA visual cuesta $0.03.

Los precios en vivo siempre están disponibles en:

GET https://mcp.soundside.ai/api/x402/status

Esto devuelve precios en USDC legibles por máquina por herramienta y por proveedor. Los precios se gestionan en base de datos y pueden cambiar — siempre consulta el endpoint en lugar de codificarlos.

x402: Pago por Llamada con Cripto

No se necesita clave API. Paga con USDC en Base (L2) por llamada de herramienta mediante EIP-3009 transferWithAuthorization (firma fuera de cadena, el facilitador paga el gas).

Network: eip155:8453 (Base mainnet)
Token: USDC
Facilitator: Coinbase CDP

Consulta la Guía x402 para la configuración completa.

Guías

Ejemplos

Enlaces