azure-aigateway

por Azure

Configurar Azure API Management (APIM) como puerta de enlace de IA para asegurar, observar y controlar modelos de IA, servidores MCP y agentes. Ayuda con limitación de velocidad, almacenamiento en caché semántico, seguridad de contenido y equilibrio de carga.

npx skills add https://github.com/microsoft/GitHub-Copilot-for-Azure --skill azure-aigateway

Azure AI Gateway

Configure Azure API Management (APIM) as an AI Gateway for governing AI models, MCP tools, and agents.

To deploy APIM, use the azure-prepare skill. See APIM deployment guide.

When to Use This Skill

CategoryTriggers
Model Governance"semantic caching", "token limits", "load balance AI", "track token usage"
Tool Governance"rate limit MCP", "protect my tools", "configure my tool", "convert API to MCP"
Agent Governance"content safety", "jailbreak detection", "filter harmful content"
Configuration"add Azure OpenAI backend", "configure my model", "add AI Foundry model"
Testing"test AI gateway", "call OpenAI through gateway"

Quick Reference

PolicyPurposeDetails
azure-openai-token-limitCost controlModel Policies
azure-openai-semantic-cache-lookup/store60-80% cost savingsModel Policies
azure-openai-emit-token-metricObservabilityModel Policies
llm-content-safetySafety & complianceAgent Policies
rate-limit-by-keyMCP/tool protectionTool Policies

Get Gateway Details

# Get gateway URL
az apim show --name <apim-name> --resource-group <rg> --query "gatewayUrl" -o tsv

# List backends (AI models)
az apim backend list --service-name <apim-name> --resource-group <rg> \
  --query "[].{id:name, url:url}" -o table

# Get subscription key
az apim subscription keys list \
  --service-name <apim-name> --resource-group <rg> --subscription-id <sub-id>

Test AI Endpoint

GATEWAY_URL=$(az apim show --name <apim-name> --resource-group <rg> --query "gatewayUrl" -o tsv)

curl -X POST "${GATEWAY_URL}/openai/deployments/<deployment>/chat/completions?api-version=2024-02-01" \
  -H "Content-Type: application/json" \
  -H "Ocp-Apim-Subscription-Key: <key>" \
  -d '{"messages": [{"role": "user", "content": "Hello"}], "max_tokens": 100}'

Common Tasks

Add AI Backend

See references/patterns.md for full steps.

# Discover AI resources
az cognitiveservices account list --query "[?kind=='OpenAI']" -o table

# Create backend
az apim backend create --service-name <apim> --resource-group <rg> \
  --backend-id openai-backend --protocol http --url "https://<aoai>.openai.azure.com/openai"

# Grant access (managed identity)
az role assignment create --assignee <apim-principal-id> \
  --role "Cognitive Services User" --scope <aoai-resource-id>

Apply AI Governance Policy

Recommended policy order in <inbound>:

  1. Authentication - Managed identity to backend
  2. Semantic Cache Lookup - Check cache before calling AI
  3. Token Limits - Cost control
  4. Content Safety - Filter harmful content
  5. Backend Selection - Load balancing
  6. Metrics - Token usage tracking

See references/policies.md for complete example.


Troubleshooting

IssueSolution
Token limit 429Increase tokens-per-minute or add load balancing
No cache hitsLower score-threshold to 0.7
Content false positivesIncrease category thresholds (5-6)
Backend auth 401Grant APIM "Cognitive Services User" role

See references/troubleshooting.md for details.


References

SDK Quick References

Más skills de Azure

azure-ai
Azure
Útil para Azure AI: Search, Speech, OpenAI, Document Intelligence. Ayuda con búsqueda, búsqueda vectorial/híbrida, conversión de voz a texto, conversión de texto a voz, transcripción, OCR.
appinsights-instrumentation
Azure
Guía para instrumentar aplicaciones web con Azure Application Insights. Proporciona patrones de telemetría, configuración del SDK y referencias de configuración.
azure-compliance
Azure
Capacidades integrales de auditoría de cumplimiento y seguridad de Azure, que incluyen evaluación de mejores prácticas, monitoreo de vencimiento de Key Vault y validación de configuración de recursos.
azure-compute
Azure
Recomendar tamaños de VM de Azure, conjuntos de escalado de máquinas virtuales (VMSS) y configuraciones según los requisitos de carga de trabajo, necesidades de rendimiento y restricciones presupuestarias.
azure-cost-optimization
Azure
Identificar y cuantificar ahorros de costos en suscripciones de Azure mediante el análisis de costos reales, métricas de utilización y la generación de recomendaciones de optimización accionables.
azure-deploy
Azure
Ejecutar despliegue en Azure. Paso final después de la preparación y validación. Ejecuta comandos azd up, azd deploy o aprovisionamiento de infraestructura.
azure-diagnostics
Azure
Depurar y solucionar problemas de producción en Azure. Cubre diagnósticos de Container Apps y Function Apps, análisis de registros con KQL, comprobaciones de estado y resolución de problemas comunes.
azure-hosted-copilot-sdk
Azure
Crea e implementa aplicaciones del SDK de GitHub Copilot en Azure.