VoiceVox
A server for text-to-speech (TTS) using the VoiceVox engine.
🤖 Agent VRM MCP サーバー
AgentVRM を介してVRMアバター機能を提供する Model Context Protocol サーバーです。このサーバーにより、Claude は AgentVRM エンジンが提供するVRMアバターを使用してテキストから音声を生成し、3Dアバターとして表現することができます。
🎥 デモ動画
https://github.com/user-attachments/assets/ea4b736d-a326-45b0-be88-b01fff6dc3f3
✨ 機能
- テキスト読み上げ: 指定したテキストを AgentVRM のVRMアバターで読み上げます。
- VRMアバター表示: 3DのVRMアバターがテキストを読み上げ、表情やアニメーションも表現します。
- 音声の自動再生: 生成した音声をその場で自動的に再生します。
- 音声ファイル保存: 生成した音声は
assetsフォルダに.wavファイルとして保存されます。
🚀 前提条件
- AgentVRM エンジンが動作していること(ローカルまたはリモートで)
- Python 3.10 以上
📦 インストール
uv の使用(推奨)
uv を使用する場合は特別なインストールは必要ありません。直接 uvx を使用して agent-vrm-mcp を実行します。
⚙️ 設定
AgentVRM エンジン
このサーバーは動作するために AgentVRM エンジンが必要です。エンジンの起動は手動で行う必要があります。
デフォルトでは http://localhost:3001/api/speak_text への接続を試みます。--api-url 引数で別の URL を指定することができます。
AgentVRM エンジンは 公式 AgentVRM リポジトリ からダウンロードしてインストールできます。
Claude Desktop 用の設定
Claude Desktop の設定に追加:
uvx を使用する場合
{
"mcpServers": {
"vrm": {
"command": "uvx",
"args": ["agent-vrm-mcp", "--api-url=http://localhost:3001/api/speak_text"]
}
}
}
🛠️ 利用可能なツール
speak_text- AgentVRM を使用してテキストを音声に変換し、VRMアバターで表現- 必須引数:
text(文字列): 音声に変換するテキスト
- オプション引数:
speaker_id(整数、デフォルト: 1): 使用する話者の IDspeed_scale(数値、デフォルト: 1.0): 再生速度の倍率auto_play(真偽値、デフォルト: True): 生成後に自動再生するか
- 必須引数:
🎵 特別な機能
- 生成後の音声は、プラットフォーム固有の方法で自動的に再生されます:
- Windows: デフォルトのシステムプレーヤーを使用
- macOS: 内蔵の
afplayユーティリティを使用 - Linux: まず
aplayを試し、失敗した場合はxdg-openにフォールバック
📁 プロジェクト構造
🧑💻 開発モードでのセットアップ・実行手順
開発者向けに、uv を用いた開発モードでのインストールおよびMCP Inspectorによる実行手順をまとめます。
# プロジェクトディレクトリで開発モードでインストール
cd C:\Prj\agent-vrm-mcp
uv sync
# 開発モードでパッケージをインストール
uv pip install -e .
# MCP Inspector で実行
npx @modelcontextprotocol/inspector python -m agent_vrm_mcp --api-url=http://localhost:3001/api/speak_text
uv syncで依存パッケージを同期します。uv pip install -e .で開発モード(編集可能インストール)を行います。- MCP Inspectorを使うことで、
agent_vrm_mcpサーバーをAPIエンドポイント指定で起動できます。
📄 ライセンス
agent-vrm-mcp は MIT ライセンスの下で提供されています。これは、MIT ライセンスの条件に従い、自由に使用、修正、配布することができることを意味します。
🔗 リンク
Related Servers
Sendblue
Send iMessage and SMS messages using the Sendblue API.
MCP Server Whisper
Advanced audio transcription and processing using OpenAI's Whisper and GPT-4o models.
Email
Automate email tasks using SMTP and IMAP protocols.
Upbit MCP Server
Access market data, manage accounts, and execute trades on the Upbit Cryptocurrency Exchange via its OpenAPI.
Ntfy MCP Server
Send push notifications via the ntfy service, enabling LLMs and AI agents to notify your devices.
MCP IDE Bridge
An open-source messaging server for client-to-client communication using MCP HTTP streaming, configurable via an external JSON file.
Salesforce MCP Server - Enhanced Edition
A Salesforce MCP server with automatic integrations for services such as WhatsApp, Slack, email, and custom webhooks.
OSMP (Octid Semantic Mesh Protocol)
Agentic AI instruction encoding. 60%+ compression over JSON. Inference-free decode. Any channel.
X MCP Server
An MCP server for X (Twitter) integration, allowing you to read timelines and engage with tweets.
Prompt for User Input MCP Server
Enables AI models to prompt users for input directly within their code editor for interactive conversations.