azure-aigateway

作成者: Azure

Azure API Management (APIM)をAIゲートウェイとして構成し、AIモデル、MCPサーバー、エージェントを保護、監視、制御します。レート制限、セマンティックキャッシング、コンテンツセーフティ、負荷分散に役立ちます。

npx skills add https://github.com/microsoft/GitHub-Copilot-for-Azure --skill azure-aigateway

Azure AI Gateway

Configure Azure API Management (APIM) as an AI Gateway for governing AI models, MCP tools, and agents.

To deploy APIM, use the azure-prepare skill. See APIM deployment guide.

When to Use This Skill

CategoryTriggers
Model Governance"semantic caching", "token limits", "load balance AI", "track token usage"
Tool Governance"rate limit MCP", "protect my tools", "configure my tool", "convert API to MCP"
Agent Governance"content safety", "jailbreak detection", "filter harmful content"
Configuration"add Azure OpenAI backend", "configure my model", "add AI Foundry model"
Testing"test AI gateway", "call OpenAI through gateway"

Quick Reference

PolicyPurposeDetails
azure-openai-token-limitCost controlModel Policies
azure-openai-semantic-cache-lookup/store60-80% cost savingsModel Policies
azure-openai-emit-token-metricObservabilityModel Policies
llm-content-safetySafety & complianceAgent Policies
rate-limit-by-keyMCP/tool protectionTool Policies

Get Gateway Details

# Get gateway URL
az apim show --name <apim-name> --resource-group <rg> --query "gatewayUrl" -o tsv

# List backends (AI models)
az apim backend list --service-name <apim-name> --resource-group <rg> \
  --query "[].{id:name, url:url}" -o table

# Get subscription key
az apim subscription keys list \
  --service-name <apim-name> --resource-group <rg> --subscription-id <sub-id>

Test AI Endpoint

GATEWAY_URL=$(az apim show --name <apim-name> --resource-group <rg> --query "gatewayUrl" -o tsv)

curl -X POST "${GATEWAY_URL}/openai/deployments/<deployment>/chat/completions?api-version=2024-02-01" \
  -H "Content-Type: application/json" \
  -H "Ocp-Apim-Subscription-Key: <key>" \
  -d '{"messages": [{"role": "user", "content": "Hello"}], "max_tokens": 100}'

Common Tasks

Add AI Backend

See references/patterns.md for full steps.

# Discover AI resources
az cognitiveservices account list --query "[?kind=='OpenAI']" -o table

# Create backend
az apim backend create --service-name <apim> --resource-group <rg> \
  --backend-id openai-backend --protocol http --url "https://<aoai>.openai.azure.com/openai"

# Grant access (managed identity)
az role assignment create --assignee <apim-principal-id> \
  --role "Cognitive Services User" --scope <aoai-resource-id>

Apply AI Governance Policy

Recommended policy order in <inbound>:

  1. Authentication - Managed identity to backend
  2. Semantic Cache Lookup - Check cache before calling AI
  3. Token Limits - Cost control
  4. Content Safety - Filter harmful content
  5. Backend Selection - Load balancing
  6. Metrics - Token usage tracking

See references/policies.md for complete example.


Troubleshooting

IssueSolution
Token limit 429Increase tokens-per-minute or add load balancing
No cache hitsLower score-threshold to 0.7
Content false positivesIncrease category thresholds (5-6)
Backend auth 401Grant APIM "Cognitive Services User" role

See references/troubleshooting.md for details.


References

SDK Quick References

Azureのその他のスキル

azure-ai
Azure
Azure AI(Search、Speech、OpenAI、Document Intelligence)に使用します。検索、ベクター/ハイブリッド検索、音声認識、音声合成、文字起こし、OCRを支援します。
appinsights-instrumentation
Azure
Azure Application Insightsを使用したWebアプリのインストルメンテーションのガイダンス。テレメトリパターン、SDKセットアップ、構成リファレンスを提供します。
azure-compliance
Azure
Azureのコンプライアンスとセキュリティ監査の包括的な機能。ベストプラクティス評価、Key Vaultの有効期限監視、リソース構成の検証を含む。
azure-compute
Azure
ワークロード要件、パフォーマンス要件、予算制約に基づいて、Azure VMサイズ、VM Scale Sets(VMSS)、および構成を推奨します。
azure-cost-optimization
Azure
Azureサブスクリプション全体の実際のコストと使用率メトリクスを分析し、実行可能な最適化推奨事項を生成することで、コスト削減を特定し定量化します。
azure-deploy
Azure
Azureへのデプロイを実行します。準備と検証の後の最終ステップです。azd up、azd deploy、またはインフラストラクチャプロビジョニングコマンドを実行します。
azure-diagnostics
Azure
Azure上での本番環境の問題をデバッグおよびトラブルシューティングします。Container AppsとFunction Appsの診断、KQLを使用したログ分析、ヘルスチェック、一般的な問題の解決をカバーします。
azure-hosted-copilot-sdk
Azure
GitHub Copilot SDKアプリをAzureに構築してデプロイします。