soundside.ai MCP Server
offiziellMCP-native KI-Medien-Generierung mit x402 Pay-per-Call. Bilder, Videos, Audio und Musik von 6 Anbietern – kombinierbar über Ressourcen-IDs. USDC auf Base.
Dokumentation
Soundside — Entwicklerdokumentation
KI-Medienproduktionsplattform für Agenten
Soundside stellt 19 MCP-Tools zur Verfügung – zum Generieren, Bearbeiten, Komponieren, Extrahieren und Analysieren von Medien: Bilder, Video, Audio, Musik, Text und Geschäftsartefakte – plus LoRA-Adapter-Fine-Tuning und serverseitige Videokomposition. Verbinden Sie jeden MCP-Client. Bezahlen Sie mit einem API-Key (Guthaben) oder mit Krypto (x402 USDC auf Base, kein Konto erforderlich).
Schnellstart
# MCP endpoint
https://mcp.soundside.ai/mcp
# Auth: API key or x402 crypto payment
Authorization: Bearer <your-api-key>
POST https://mcp.soundside.ai/mcp
{"jsonrpc":"2.0","id":"1","method":"tools/list","params":{}}
Tools (19)
Generierung
| Tool | Funktion | Anbieter |
|---|---|---|
create_image | Text-zu-Bild, Zeichenreferenzen | Alibaba (Wan), Grok, Luma, MiniMax, Runway, Vertex AI |
create_video | Text-zu-Video, Bild-zu-Video, Videoerweiterung | Alibaba (Wan), Grok, Luma, MiniMax, Runway, Vertex AI (Veo 3.1) |
create_audio | TTS, Soundeffekte, Stimmklonen, Stimmdesign | MiniMax, Runway, Vertex AI |
create_music | Musik aus Liedtexten und Stilvorgaben | MiniMax |
create_text | LLM-Chat-Vervollständigungen, strukturierte Ausgabe | Grok, MiniMax, Vertex AI (Gemini) |
create_artifact | Diagramme, Präsentationen, Dokumente, Schaubilder; Bundle-Modus für Multi-Artefakt-Pakete | plotly, pptx, docx, weasyprint, mermaid, gamma |
Komposition
| Tool | Funktion |
|---|---|
compose_video | Serverseitige Pipeline: Plan anreichern, Assets parallel generieren, mit Übergängen, Audio-Ducking und Overlays zusammenfügen |
Bearbeitung
| Tool | Funktion |
|---|---|
edit_video | Kern-Videotransformationen: Trimmen, Verketten, Überblenden, Geschwindigkeit, Schleife, Farbkorrektur, Untertitel einbrennen, benutzerdefiniertes FFmpeg |
edit_audio | Audio mischen, ersetzen oder auf vorhandene Medien aufpolstern |
compose_media | Text hinzufügen, Medien überlagern oder Split-Screen-Kompositionen erstellen |
apply_effect | Ken Burns, Geschwindigkeitsrampe, Filmkorn, Vignette |
extract_media | Einzelbilder, Bilderserien oder Audiospuren extrahieren |
Analyse
| Tool | Funktion | Anbieter |
|---|---|---|
analyze_media | Technische Metadaten, Vision QA, Transkription, Segmenterkennung, EDL-Export | Anthropic, Grok, OpenAI, Qwen, Vertex (+ soundside.ai ffprobe) |
Adapter (LoRA)
| Tool | Funktion | Backends |
|---|---|---|
train_adapter | LoRA-Adapter aus Bibliotheksmedien trainieren | DashScope (Wan), Modal (Hunyuan/LTX) |
list_adapters | Ihre LoRA-Adapter auflisten | |
manage_adapter | Inspizieren, bereitstellen, Bereitstellung aufheben, löschen oder Checkpoint auswählen |
Bibliotheksverwaltung
| Tool | Funktion |
|---|---|
lib_list | Projekte, Sammlungen, Ressourcen, Herkunft, Marken-Kits durchsuchen; Guthaben abfragen |
lib_manage | CRUD für Projekte, Sammlungen, Ressourcen, Marken-Kits |
lib_share | Projekte mit anderen Benutzern per E-Mail teilen |
Preise
Soundside strebt an, die Durchleitungskosten der Anbieter mit einer kleinen Marge (~10 %) zu decken. Die Bearbeitungs-Engine und die Bibliothek kosten $0,01/Aufruf; Vision QA kostet $0,03.
Live-Preise sind jederzeit verfügbar unter:
GET https://mcp.soundside.ai/api/x402/status
Dies liefert maschinenlesbare USDC-Preise pro Tool und Anbieter. Die Preise sind datenbankgesteuert und können sich ändern — überprüfen Sie immer den Endpunkt, anstatt sie fest zu codieren.
x402: Pay-Per-Call mit Krypto
Kein API-Key erforderlich. Bezahlen Sie mit USDC auf Base (L2) pro Tool-Aufruf via EIP-3009 transferWithAuthorization (Off-Chain-Signierung, Vermittler zahlt Gas).
Network: eip155:8453 (Base mainnet)
Token: USDC
Facilitator: Coinbase CDP
Siehe x402-Anleitung für die vollständige Einrichtung.
Anleitungen
- Erste Schritte — Erste MCP-Verbindung in 5 Minuten
- x402 Pay-Per-Call — Krypto-Zahlungen, kein Konto erforderlich
- Tool-Referenz — Detaillierte Dokumentation für alle 19 Tools
Beispiele
- Python — API-Key — Verbinden und generieren mit httpx
- Python — x402 — Pay-per-Call mit USDC
- TypeScript — API-Key — Node.js MCP-Client
- OpenClaw Skill — Einzeilige Konfiguration für OpenClaw-Agenten
Links
- Website: soundside.ai
- MCP-Endpunkt:
https://mcp.soundside.ai/mcp - Live-Preise:
https://mcp.soundside.ai/api/x402/status - GitHub: github.com/soundside-design/soundside-docs