soundside.ai MCP Server

ทางการ

การสร้างสื่อ AI แบบ MCP ดั้งเดิมพร้อมการชำระเงินต่อการเรียกใช้แบบ x402 รูปภาพ วิดีโอ เสียง และเพลงจาก 6 ผู้ให้บริการ — สามารถประกอบได้ผ่านรหัสทรัพยากร USDC บน Base

เอกสาร

Soundside — เอกสารสำหรับนักพัฒนา

แพลตฟอร์มการผลิตสื่อด้วย AI สำหรับเอเจนต์

Soundside มีเครื่องมือ MCP 19 รายการสำหรับการสร้าง แก้ไข ประกอบ แยก และวิเคราะห์สื่อ — รูปภาพ วิดีโอ เสียง เพลง ข้อความ และสิ่งประดิษฐ์ทางธุรกิจ — รวมถึงการปรับแต่ง LoRA adapter และการประกอบวิดีโอฝั่งเซิร์ฟเวอร์ เชื่อมต่อกับ MCP client ใดก็ได้ ชำระเงินด้วย API key (เครดิต) หรือคริปโต (x402 USDC บน Base ไม่ต้องมีบัญชี)

เริ่มต้นอย่างรวดเร็ว

# MCP endpoint
https://mcp.soundside.ai/mcp

# Auth: API key or x402 crypto payment
Authorization: Bearer <your-api-key>
POST https://mcp.soundside.ai/mcp
{"jsonrpc":"2.0","id":"1","method":"tools/list","params":{}}

เครื่องมือ (19)

การสร้าง

เครื่องมือสิ่งที่ทำผู้ให้บริการ
create_imageข้อความเป็นรูปภาพ, การอ้างอิงตัวละครAlibaba (Wan), Grok, Luma, MiniMax, Runway, Vertex AI
create_videoข้อความเป็นวิดีโอ, รูปภาพเป็นวิดีโอ, การขยายวิดีโอAlibaba (Wan), Grok, Luma, MiniMax, Runway, Vertex AI (Veo 3.1)
create_audioTTS, เอฟเฟกต์เสียง, การโคลนเสียง, การออกแบบเสียงMiniMax, Runway, Vertex AI
create_musicเพลงจากเนื้อเพลงและพรอมต์สไตล์MiniMax
create_textการเติมเต็มข้อความแชท LLM, ผลลัพธ์ที่มีโครงสร้างGrok, MiniMax, Vertex AI (Gemini)
create_artifactแผนภูมิ, งานนำเสนอ, เอกสาร, ไดอะแกรม; โหมด bundle สำหรับแพ็คเกจหลายสิ่งประดิษฐ์plotly, pptx, docx, weasyprint, mermaid, gamma

การประกอบ

เครื่องมือสิ่งที่ทำ
compose_videoไปป์ไลน์ฝั่งเซิร์ฟเวอร์: เพิ่มคุณค่าแผน, สร้างสินทรัพย์แบบขนาน, ประกอบด้วยทรานซิชัน, การลดเสียงพื้นหลัง, และการซ้อนทับ

การแก้ไข

เครื่องมือสิ่งที่ทำ
edit_videoการแปลงวิดีโอหลัก: ตัด, ต่อ, ครอสเฟด, ความเร็ว, วนซ้ำ, ปรับแต่งสี, เบิร์นคำบรรยาย, FFmpeg แบบกำหนดเอง
edit_audioผสม, แทนที่, หรือเพิ่มเสียงบนสื่อที่มีอยู่
compose_mediaเพิ่มข้อความ, ซ้อนทับสื่อ, หรือสร้างคอมโพสิตแบบแบ่งหน้าจอ
apply_effectKen Burns, การเร่งความเร็ว, ฟิล์มเกรน, วิกเน็ตต์
extract_mediaแยกเฟรม, ชุดเฟรม, หรือแทร็กเสียง

การวิเคราะห์

เครื่องมือสิ่งที่ทำผู้ให้บริการ
analyze_mediaเมตาดาทาทางเทคนิค, การถามตอบด้วยภาพ, การถอดเสียง, การตรวจจับส่วน, การส่งออก EDLAnthropic, Grok, OpenAI, Qwen, Vertex (+ soundside.ai ffprobe)

อะแดปเตอร์ (LoRA)

เครื่องมือสิ่งที่ทำแบ็กเอนด์
train_adapterฝึก LoRA adapter จากสื่อในคลังDashScope (Wan), Modal (Hunyuan/LTX)
list_adaptersแสดงรายการ LoRA adapters ของคุณ
manage_adapterตรวจสอบ, ดีพลอย, ยกเลิกดีพลอย, ลบ, หรือเลือกเช็คพอยต์

การจัดการคลัง

เครื่องมือสิ่งที่ทำ
lib_listเรียกดูโปรเจกต์, คอลเลกชัน, ทรัพยากร, เชื้อสาย, ชุดแบรนด์; สอบถามยอดเครดิต
lib_manageCRUD สำหรับโปรเจกต์, คอลเลกชัน, ทรัพยากร, ชุดแบรนด์
lib_shareแชร์โปรเจกต์กับผู้ใช้รายอื่นทางอีเมล

ราคา

Soundside มุ่งหวังที่จะคุ้มทุนจากค่าใช้จ่ายส่งผ่านของผู้ให้บริการโดยมีส่วนต่างเล็กน้อย (~10%) เอนจินการแก้ไขและคลังคิดราคาที่ $0.01/ครั้ง; การถามตอบด้วยภาพคิด $0.03

ราคาสดสามารถดูได้เสมอที่:

GET https://mcp.soundside.ai/api/x402/status

สิ่งนี้จะคืนค่าราคา USDC แบบ machine-readable ต่อเครื่องมือ ต่อผู้ให้บริการ ราคาถูกขับเคลื่อนด้วยฐานข้อมูลและอาจเปลี่ยนแปลง — ควรตรวจสอบที่เอนด์พอยต์เสมอแทนที่จะฮาร์ดโค้ด

x402: จ่ายต่อครั้งด้วยคริปโต

ไม่ต้องใช้ API key จ่ายด้วย USDC บน Base (L2) ต่อการเรียกใช้เครื่องมือผ่าน EIP-3009 transferWithAuthorization (การเซ็นนอกเชน, facilitator จ่ายค่าแก๊ส)

Network: eip155:8453 (Base mainnet)
Token: USDC
Facilitator: Coinbase CDP

ดู คู่มือ x402 สำหรับการตั้งค่าแบบเต็ม

คู่มือ

ตัวอย่าง

  • Python — API Key — เชื่อมต่อและสร้างด้วย httpx
  • Python — x402 — จ่ายต่อครั้งด้วย USDC
  • TypeScript — API Key — MCP client สำหรับ Node.js
  • OpenClaw Skill — การกำหนดค่าบรรทัดเดียวสำหรับเอเจนต์ OpenClaw

ลิงก์