soundside.ai MCP Server

chính thức

Tạo phương tiện AI gốc MCP với x402 trả tiền theo cuộc gọi. Hình ảnh, video, âm thanh và nhạc từ 6 nhà cung cấp — có thể kết hợp qua ID tài nguyên. USDC trên Base.

Tài liệu

Soundside — Tài liệu dành cho nhà phát triển

Nền tảng sản xuất truyền thông AI cho các tác nhân

Soundside cung cấp 19 công cụ MCP để tạo, chỉnh sửa, biên soạn, trích xuất và phân tích phương tiện — hình ảnh, video, âm thanh, nhạc, văn bản và các tạo phẩm kinh doanh — cùng với tinh chỉnh bộ điều hợp LoRA và biên soạn video phía máy chủ. Kết nối với bất kỳ máy khách MCP nào. Thanh toán bằng khóa API (tín dụng) hoặc tiền mã hóa (x402 USDC trên Base, không cần tài khoản).

Bắt đầu nhanh

# MCP endpoint
https://mcp.soundside.ai/mcp

# Auth: API key or x402 crypto payment
Authorization: Bearer <your-api-key>
POST https://mcp.soundside.ai/mcp
{"jsonrpc":"2.0","id":"1","method":"tools/list","params":{}}

Công cụ (19)

Tạo sinh

Công cụChức năngNhà cung cấp
create_imageVăn bản thành hình ảnh, tham chiếu nhân vậtAlibaba (Wan), Grok, Luma, MiniMax, Runway, Vertex AI
create_videoVăn bản thành video, hình ảnh thành video, mở rộng videoAlibaba (Wan), Grok, Luma, MiniMax, Runway, Vertex AI (Veo 3.1)
create_audioTTS, hiệu ứng âm thanh, nhân bản giọng nói, thiết kế giọng nóiMiniMax, Runway, Vertex AI
create_musicNhạc từ lời bài hát và gợi ý phong cáchMiniMax
create_textHoàn thành trò chuyện LLM, đầu ra có cấu trúcGrok, MiniMax, Vertex AI (Gemini)
create_artifactBiểu đồ, bài thuyết trình, tài liệu, sơ đồ; chế độ gói cho các gói đa tạo phẩmplotly, pptx, docx, weasyprint, mermaid, gamma

Biên soạn

Công cụChức năng
compose_videoQuy trình phía máy chủ: làm giàu kế hoạch, tạo tài sản song song, lắp ráp với chuyển cảnh, giảm âm thanh và lớp phủ

Chỉnh sửa

Công cụChức năng
edit_videoBiến đổi video cốt lõi: cắt, nối, mờ chéo, tốc độ, lặp, chỉnh màu, chèn phụ đề, FFmpeg tùy chỉnh
edit_audioTrộn, thay thế hoặc đệm âm thanh trên phương tiện hiện có
compose_mediaThêm văn bản, lớp phủ phương tiện hoặc xây dựng tổ hợp chia màn hình
apply_effectKen Burns, tăng tốc độ, hạt phim, họa tiết
extract_mediaTrích xuất khung hình, bộ khung hình hoặc bản âm thanh

Phân tích

Công cụChức năngNhà cung cấp
analyze_mediaSiêu dữ liệu kỹ thuật, QA thị giác, phiên âm, phát hiện phân đoạn, xuất EDLAnthropic, Grok, OpenAI, Qwen, Vertex (+ soundside.ai ffprobe)

Bộ điều hợp (LoRA)

Công cụChức năngPhụ trợ
train_adapterHuấn luyện bộ điều hợp LoRA từ phương tiện thư việnDashScope (Wan), Modal (Hunyuan/LTX)
list_adaptersLiệt kê các bộ điều hợp LoRA của bạn
manage_adapterKiểm tra, triển khai, hủy triển khai, xóa hoặc chọn điểm kiểm tra

Quản lý thư viện

Công cụChức năng
lib_listDuyệt dự án, bộ sưu tập, tài nguyên, dòng dõi, bộ nhận diện thương hiệu; truy vấn số dư tín dụng
lib_manageCRUD cho dự án, bộ sưu tập, tài nguyên, bộ nhận diện thương hiệu
lib_shareChia sẻ dự án với người dùng khác qua email

Giá cả

Soundside hướng tới hòa vốn chi phí chuyển tiếp từ nhà cung cấp với biên lợi nhuận nhỏ (~10%). Công cụ chỉnh sửa và thư viện có giá $0.01/lần gọi; QA thị giác là $0.03.

Giá trực tiếp luôn có sẵn tại:

GET https://mcp.soundside.ai/api/x402/status

Điều này trả về giá USDC theo từng công cụ, từng nhà cung cấp dưới dạng máy đọc được. Giá được điều khiển bởi cơ sở dữ liệu và có thể thay đổi — luôn kiểm tra điểm cuối thay vì mã hóa cứng.

x402: Thanh toán theo lần gọi bằng tiền mã hóa

Không cần khóa API. Thanh toán bằng USDC trên Base (L2) cho mỗi lần gọi công cụ qua EIP-3009 transferWithAuthorization (ký ngoại tuyến, bên hỗ trợ trả phí gas).

Network: eip155:8453 (Base mainnet)
Token: USDC
Facilitator: Coinbase CDP

Xem Hướng dẫn x402 để thiết lập đầy đủ.

Hướng dẫn

Ví dụ

Liên kết