soundside.ai MCP Server

offiziell

MCP-native KI-Medien-Generierung mit x402 Pay-per-Call. Bilder, Videos, Audio und Musik von 6 Anbietern – kombinierbar über Ressourcen-IDs. USDC auf Base.

Dokumentation

Soundside — Entwicklerdokumentation

KI-Medienproduktionsplattform für Agenten

Soundside stellt 19 MCP-Tools zur Verfügung – zum Generieren, Bearbeiten, Komponieren, Extrahieren und Analysieren von Medien: Bilder, Video, Audio, Musik, Text und Geschäftsartefakte – plus LoRA-Adapter-Fine-Tuning und serverseitige Videokomposition. Verbinden Sie jeden MCP-Client. Bezahlen Sie mit einem API-Key (Guthaben) oder mit Krypto (x402 USDC auf Base, kein Konto erforderlich).

Schnellstart

# MCP endpoint
https://mcp.soundside.ai/mcp

# Auth: API key or x402 crypto payment
Authorization: Bearer <your-api-key>
POST https://mcp.soundside.ai/mcp
{"jsonrpc":"2.0","id":"1","method":"tools/list","params":{}}

Tools (19)

Generierung

ToolFunktionAnbieter
create_imageText-zu-Bild, ZeichenreferenzenAlibaba (Wan), Grok, Luma, MiniMax, Runway, Vertex AI
create_videoText-zu-Video, Bild-zu-Video, VideoerweiterungAlibaba (Wan), Grok, Luma, MiniMax, Runway, Vertex AI (Veo 3.1)
create_audioTTS, Soundeffekte, Stimmklonen, StimmdesignMiniMax, Runway, Vertex AI
create_musicMusik aus Liedtexten und StilvorgabenMiniMax
create_textLLM-Chat-Vervollständigungen, strukturierte AusgabeGrok, MiniMax, Vertex AI (Gemini)
create_artifactDiagramme, Präsentationen, Dokumente, Schaubilder; Bundle-Modus für Multi-Artefakt-Paketeplotly, pptx, docx, weasyprint, mermaid, gamma

Komposition

ToolFunktion
compose_videoServerseitige Pipeline: Plan anreichern, Assets parallel generieren, mit Übergängen, Audio-Ducking und Overlays zusammenfügen

Bearbeitung

ToolFunktion
edit_videoKern-Videotransformationen: Trimmen, Verketten, Überblenden, Geschwindigkeit, Schleife, Farbkorrektur, Untertitel einbrennen, benutzerdefiniertes FFmpeg
edit_audioAudio mischen, ersetzen oder auf vorhandene Medien aufpolstern
compose_mediaText hinzufügen, Medien überlagern oder Split-Screen-Kompositionen erstellen
apply_effectKen Burns, Geschwindigkeitsrampe, Filmkorn, Vignette
extract_mediaEinzelbilder, Bilderserien oder Audiospuren extrahieren

Analyse

ToolFunktionAnbieter
analyze_mediaTechnische Metadaten, Vision QA, Transkription, Segmenterkennung, EDL-ExportAnthropic, Grok, OpenAI, Qwen, Vertex (+ soundside.ai ffprobe)

Adapter (LoRA)

ToolFunktionBackends
train_adapterLoRA-Adapter aus Bibliotheksmedien trainierenDashScope (Wan), Modal (Hunyuan/LTX)
list_adaptersIhre LoRA-Adapter auflisten
manage_adapterInspizieren, bereitstellen, Bereitstellung aufheben, löschen oder Checkpoint auswählen

Bibliotheksverwaltung

ToolFunktion
lib_listProjekte, Sammlungen, Ressourcen, Herkunft, Marken-Kits durchsuchen; Guthaben abfragen
lib_manageCRUD für Projekte, Sammlungen, Ressourcen, Marken-Kits
lib_shareProjekte mit anderen Benutzern per E-Mail teilen

Preise

Soundside strebt an, die Durchleitungskosten der Anbieter mit einer kleinen Marge (~10 %) zu decken. Die Bearbeitungs-Engine und die Bibliothek kosten $0,01/Aufruf; Vision QA kostet $0,03.

Live-Preise sind jederzeit verfügbar unter:

GET https://mcp.soundside.ai/api/x402/status

Dies liefert maschinenlesbare USDC-Preise pro Tool und Anbieter. Die Preise sind datenbankgesteuert und können sich ändern — überprüfen Sie immer den Endpunkt, anstatt sie fest zu codieren.

x402: Pay-Per-Call mit Krypto

Kein API-Key erforderlich. Bezahlen Sie mit USDC auf Base (L2) pro Tool-Aufruf via EIP-3009 transferWithAuthorization (Off-Chain-Signierung, Vermittler zahlt Gas).

Network: eip155:8453 (Base mainnet)
Token: USDC
Facilitator: Coinbase CDP

Siehe x402-Anleitung für die vollständige Einrichtung.

Anleitungen

Beispiele

Links