azure-aigateway

par Azure

Configurer Azure API Management (APIM) en tant que passerelle IA pour sécuriser, observer, contrôler les modèles d'IA, les serveurs MCP et les agents. Aide avec la limitation de débit, la mise en cache sémantique, la sécurité du contenu et l'équilibrage de charge.

npx skills add https://github.com/microsoft/GitHub-Copilot-for-Azure --skill azure-aigateway

Azure AI Gateway

Configure Azure API Management (APIM) as an AI Gateway for governing AI models, MCP tools, and agents.

To deploy APIM, use the azure-prepare skill. See APIM deployment guide.

When to Use This Skill

CategoryTriggers
Model Governance"semantic caching", "token limits", "load balance AI", "track token usage"
Tool Governance"rate limit MCP", "protect my tools", "configure my tool", "convert API to MCP"
Agent Governance"content safety", "jailbreak detection", "filter harmful content"
Configuration"add Azure OpenAI backend", "configure my model", "add AI Foundry model"
Testing"test AI gateway", "call OpenAI through gateway"

Quick Reference

PolicyPurposeDetails
azure-openai-token-limitCost controlModel Policies
azure-openai-semantic-cache-lookup/store60-80% cost savingsModel Policies
azure-openai-emit-token-metricObservabilityModel Policies
llm-content-safetySafety & complianceAgent Policies
rate-limit-by-keyMCP/tool protectionTool Policies

Get Gateway Details

# Get gateway URL
az apim show --name <apim-name> --resource-group <rg> --query "gatewayUrl" -o tsv

# List backends (AI models)
az apim backend list --service-name <apim-name> --resource-group <rg> \
  --query "[].{id:name, url:url}" -o table

# Get subscription key
az apim subscription keys list \
  --service-name <apim-name> --resource-group <rg> --subscription-id <sub-id>

Test AI Endpoint

GATEWAY_URL=$(az apim show --name <apim-name> --resource-group <rg> --query "gatewayUrl" -o tsv)

curl -X POST "${GATEWAY_URL}/openai/deployments/<deployment>/chat/completions?api-version=2024-02-01" \
  -H "Content-Type: application/json" \
  -H "Ocp-Apim-Subscription-Key: <key>" \
  -d '{"messages": [{"role": "user", "content": "Hello"}], "max_tokens": 100}'

Common Tasks

Add AI Backend

See references/patterns.md for full steps.

# Discover AI resources
az cognitiveservices account list --query "[?kind=='OpenAI']" -o table

# Create backend
az apim backend create --service-name <apim> --resource-group <rg> \
  --backend-id openai-backend --protocol http --url "https://<aoai>.openai.azure.com/openai"

# Grant access (managed identity)
az role assignment create --assignee <apim-principal-id> \
  --role "Cognitive Services User" --scope <aoai-resource-id>

Apply AI Governance Policy

Recommended policy order in <inbound>:

  1. Authentication - Managed identity to backend
  2. Semantic Cache Lookup - Check cache before calling AI
  3. Token Limits - Cost control
  4. Content Safety - Filter harmful content
  5. Backend Selection - Load balancing
  6. Metrics - Token usage tracking

See references/policies.md for complete example.


Troubleshooting

IssueSolution
Token limit 429Increase tokens-per-minute or add load balancing
No cache hitsLower score-threshold to 0.7
Content false positivesIncrease category thresholds (5-6)
Backend auth 401Grant APIM "Cognitive Services User" role

See references/troubleshooting.md for details.


References

SDK Quick References

Plus de skills de Azure

azure-ai
Azure
Utilisé pour Azure AI : Recherche, Parole, OpenAI, Intelligence Documentaire. Aide avec la recherche, la recherche vectorielle/hybride, la parole-texte, texte-parole, transcription, OCR.
appinsights-instrumentation
Azure
Conseils pour instrumenter les applications web avec Azure Application Insights. Fournit des modèles de télémétrie, la configuration du SDK et des références de configuration.
azure-compliance
Azure
Capacités complètes d'audit de conformité et de sécurité Azure, incluant l'évaluation des meilleures pratiques, la surveillance des expirations de Key Vault et la validation de la configuration des ressources.
azure-compute
Azure
Recommander les tailles de machines virtuelles Azure, les groupes de machines virtuelles identiques (VMSS) et les configurations en fonction des exigences de charge de travail, des besoins de performance et des contraintes budgétaires.
azure-cost-optimization
Azure
Identifier et quantifier les économies de coûts dans les abonnements Azure en analysant les coûts réels, les métriques d'utilisation et en générant des recommandations d'optimisation exploitables.
azure-deploy
Azure
Exécuter le déploiement vers Azure. Dernière étape après la préparation et la validation. Exécute les commandes azd up, azd deploy ou de provisionnement d'infrastructure.
azure-diagnostics
Azure
Déboguer et résoudre les problèmes de production sur Azure. Couvre les diagnostics de Container Apps et Function Apps, l'analyse des logs avec KQL, les vérifications de santé et la résolution des problèmes courants.
azure-hosted-copilot-sdk
Azure
Créez et déployez des applications GitHub Copilot SDK sur Azure.