VoiceVox
A server for text-to-speech (TTS) using the VoiceVox engine.
🤖 Agent VRM MCP サーバー
AgentVRM を介してVRMアバター機能を提供する Model Context Protocol サーバーです。このサーバーにより、Claude は AgentVRM エンジンが提供するVRMアバターを使用してテキストから音声を生成し、3Dアバターとして表現することができます。
🎥 デモ動画
https://github.com/user-attachments/assets/ea4b736d-a326-45b0-be88-b01fff6dc3f3
✨ 機能
- テキスト読み上げ: 指定したテキストを AgentVRM のVRMアバターで読み上げます。
- VRMアバター表示: 3DのVRMアバターがテキストを読み上げ、表情やアニメーションも表現します。
- 音声の自動再生: 生成した音声をその場で自動的に再生します。
- 音声ファイル保存: 生成した音声は
assetsフォルダに.wavファイルとして保存されます。
🚀 前提条件
- AgentVRM エンジンが動作していること(ローカルまたはリモートで)
- Python 3.10 以上
📦 インストール
uv の使用(推奨)
uv を使用する場合は特別なインストールは必要ありません。直接 uvx を使用して agent-vrm-mcp を実行します。
⚙️ 設定
AgentVRM エンジン
このサーバーは動作するために AgentVRM エンジンが必要です。エンジンの起動は手動で行う必要があります。
デフォルトでは http://localhost:3001/api/speak_text への接続を試みます。--api-url 引数で別の URL を指定することができます。
AgentVRM エンジンは 公式 AgentVRM リポジトリ からダウンロードしてインストールできます。
Claude Desktop 用の設定
Claude Desktop の設定に追加:
uvx を使用する場合
{
"mcpServers": {
"vrm": {
"command": "uvx",
"args": ["agent-vrm-mcp", "--api-url=http://localhost:3001/api/speak_text"]
}
}
}
🛠️ 利用可能なツール
speak_text- AgentVRM を使用してテキストを音声に変換し、VRMアバターで表現- 必須引数:
text(文字列): 音声に変換するテキスト
- オプション引数:
speaker_id(整数、デフォルト: 1): 使用する話者の IDspeed_scale(数値、デフォルト: 1.0): 再生速度の倍率auto_play(真偽値、デフォルト: True): 生成後に自動再生するか
- 必須引数:
🎵 特別な機能
- 生成後の音声は、プラットフォーム固有の方法で自動的に再生されます:
- Windows: デフォルトのシステムプレーヤーを使用
- macOS: 内蔵の
afplayユーティリティを使用 - Linux: まず
aplayを試し、失敗した場合はxdg-openにフォールバック
📁 プロジェクト構造
🧑💻 開発モードでのセットアップ・実行手順
開発者向けに、uv を用いた開発モードでのインストールおよびMCP Inspectorによる実行手順をまとめます。
# プロジェクトディレクトリで開発モードでインストール
cd C:\Prj\agent-vrm-mcp
uv sync
# 開発モードでパッケージをインストール
uv pip install -e .
# MCP Inspector で実行
npx @modelcontextprotocol/inspector python -m agent_vrm_mcp --api-url=http://localhost:3001/api/speak_text
uv syncで依存パッケージを同期します。uv pip install -e .で開発モード(編集可能インストール)を行います。- MCP Inspectorを使うことで、
agent_vrm_mcpサーバーをAPIエンドポイント指定で起動できます。
📄 ライセンス
agent-vrm-mcp は MIT ライセンスの下で提供されています。これは、MIT ライセンスの条件に従い、自由に使用、修正、配布することができることを意味します。
🔗 リンク
Related Servers
The Colony
Remote MCP server for The Colony — a social network for AI agents (400+ agents, 3,800+ posts). 15 tools including search / post / comment / vote / react / DM / notifications, 5 resources (incl. a one-call polling diff), 2 resource templates, 3 prompts. Streamable HTTP, JWT Bearer auth.
MCP Telegram
Control Telegram using LLMs through the Model Context Protocol (MCP).
Audio MCP Server
Provides audio input and output capabilities for AI assistants.
Gmail
Search and delete emails in your Gmail account.
Slack
Interact with Slack workspaces using the Slack API.
Help Scout
An MCP server that enables AI assistants to interact with Help Scout data, such as customers and conversations.
Pikud Haoref Real-Time Alert System
Provides real-time access to Israeli emergency alerts from the official Pikud Haoref API.
BlueSky
Access the BlueSky social network data via its official API.
better-telegram-mcp
Production-grade MCP server for Telegram with dual-mode Bot API + MTProto, 6 composite tools
Notifications
Send native macOS notifications with full Notification Center integration and interactive features.