soundside.ai MCP Server

官方

基于MCP原生的人工智能媒体生成,采用x402按次付费模式。支持来自6家提供商的图像、视频、音频和音乐生成,可通过资源ID进行组合。使用Base链上的USDC结算。

文档

Soundside — 开发者文档

面向智能体的 AI 媒体制作平台

Soundside 提供 19 个 MCP 工具,用于生成、编辑、合成、提取和分析媒体——图像、视频、音频、音乐、文本和业务构件——以及 LoRA 适配器微调和服务器端视频合成。可连接任何 MCP 客户端。使用 API 密钥(点数)或加密货币(Base 上的 x402 USDC,无需账户)支付。

快速开始

# MCP endpoint
https://mcp.soundside.ai/mcp

# Auth: API key or x402 crypto payment
Authorization: Bearer <your-api-key>
POST https://mcp.soundside.ai/mcp
{"jsonrpc":"2.0","id":"1","method":"tools/list","params":{}}

工具 (19)

生成

工具功能提供商
create_image文生图、角色参考Alibaba (Wan)、Grok、Luma、MiniMax、Runway、Vertex AI
create_video文生视频、图生视频、视频延长Alibaba (Wan)、Grok、Luma、MiniMax、Runway、Vertex AI (Veo 3.1)
create_audioTTS、音效、语音克隆、语音设计MiniMax、Runway、Vertex AI
create_music根据歌词和风格提示生成音乐MiniMax
create_textLLM 聊天补全、结构化输出Grok、MiniMax、Vertex AI (Gemini)
create_artifact图表、演示文稿、文档、示意图;支持打包模式生成多构件组合plotly、pptx、docx、weasyprint、mermaid、gamma

合成

工具功能
compose_video服务器端流水线:丰富计划、并行生成素材、使用转场、音频闪避和叠加层进行组装

编辑

工具功能
edit_video核心视频变换:裁剪、拼接、交叉淡入淡出、变速、循环、调色、烧录字幕、自定义 FFmpeg
edit_audio在现有媒体上混合、替换或填充音频
compose_media添加文本、叠加媒体或构建分屏合成
apply_effectKen Burns 效果、变速斜坡、胶片颗粒、暗角
extract_media提取帧、帧集或音轨

分析

工具功能提供商
analyze_media技术元数据、视觉问答、转录、片段检测、EDL 导出Anthropic、Grok、OpenAI、Qwen、Vertex(以及 soundside.ai ffprobe)

适配器 (LoRA)

工具功能后端
train_adapter从库媒体训练 LoRA 适配器DashScope (Wan)、Modal (Hunyuan/LTX)
list_adapters列出您的 LoRA 适配器
manage_adapter检查、部署、取消部署、删除或选择检查点

库管理

工具功能
lib_list浏览项目、集合、资源、谱系、品牌套件;查询点数余额
lib_manage项目、集合、资源、品牌套件的增删改查
lib_share通过电子邮件与其他用户共享项目

定价

Soundside 旨在以小幅加价(约 10%)实现提供商转嫁成本的收支平衡。编辑引擎和库的定价为每次调用 $0.01;视觉问答为 $0.03。

实时定价始终可在以下地址获取:

GET https://mcp.soundside.ai/api/x402/status

这将返回机器可读的每个工具、每个提供商的 USDC 价格。价格由数据库驱动,可能会发生变化——请始终查询端点,而不是硬编码

x402:使用加密货币按次付费

无需 API 密钥。通过 EIP-3009 transferWithAuthorization(链下签名, facilitator 支付 gas 费),使用 Base (L2) 上的 USDC 按工具调用付费。

Network: eip155:8453 (Base mainnet)
Token: USDC
Facilitator: Coinbase CDP

完整设置请参阅 x402 指南

指南

示例

链接