azure-aigateway
작성자: Azure
Azure API Management(APIM)을 AI 게이트웨이로 구성하여 AI 모델, MCP 서버, 에이전트를 보호, 관찰, 제어합니다. 속도 제한, 의미론적 캐싱, 콘텐츠 안전, 로드 밸런싱에 도움이 됩니다.
npx skills add https://github.com/microsoft/GitHub-Copilot-for-Azure --skill azure-aigatewayAzure AI Gateway
Configure Azure API Management (APIM) as an AI Gateway for governing AI models, MCP tools, and agents.
To deploy APIM, use the azure-prepare skill. See APIM deployment guide.
When to Use This Skill
| Category | Triggers |
|---|---|
| Model Governance | "semantic caching", "token limits", "load balance AI", "track token usage" |
| Tool Governance | "rate limit MCP", "protect my tools", "configure my tool", "convert API to MCP" |
| Agent Governance | "content safety", "jailbreak detection", "filter harmful content" |
| Configuration | "add Azure OpenAI backend", "configure my model", "add AI Foundry model" |
| Testing | "test AI gateway", "call OpenAI through gateway" |
Quick Reference
| Policy | Purpose | Details |
|---|---|---|
azure-openai-token-limit | Cost control | Model Policies |
azure-openai-semantic-cache-lookup/store | 60-80% cost savings | Model Policies |
azure-openai-emit-token-metric | Observability | Model Policies |
llm-content-safety | Safety & compliance | Agent Policies |
rate-limit-by-key | MCP/tool protection | Tool Policies |
Get Gateway Details
# Get gateway URL
az apim show --name <apim-name> --resource-group <rg> --query "gatewayUrl" -o tsv
# List backends (AI models)
az apim backend list --service-name <apim-name> --resource-group <rg> \
--query "[].{id:name, url:url}" -o table
# Get subscription key
az apim subscription keys list \
--service-name <apim-name> --resource-group <rg> --subscription-id <sub-id>
Test AI Endpoint
GATEWAY_URL=$(az apim show --name <apim-name> --resource-group <rg> --query "gatewayUrl" -o tsv)
curl -X POST "${GATEWAY_URL}/openai/deployments/<deployment>/chat/completions?api-version=2024-02-01" \
-H "Content-Type: application/json" \
-H "Ocp-Apim-Subscription-Key: <key>" \
-d '{"messages": [{"role": "user", "content": "Hello"}], "max_tokens": 100}'
Common Tasks
Add AI Backend
See references/patterns.md for full steps.
# Discover AI resources
az cognitiveservices account list --query "[?kind=='OpenAI']" -o table
# Create backend
az apim backend create --service-name <apim> --resource-group <rg> \
--backend-id openai-backend --protocol http --url "https://<aoai>.openai.azure.com/openai"
# Grant access (managed identity)
az role assignment create --assignee <apim-principal-id> \
--role "Cognitive Services User" --scope <aoai-resource-id>
Apply AI Governance Policy
Recommended policy order in <inbound>:
- Authentication - Managed identity to backend
- Semantic Cache Lookup - Check cache before calling AI
- Token Limits - Cost control
- Content Safety - Filter harmful content
- Backend Selection - Load balancing
- Metrics - Token usage tracking
See references/policies.md for complete example.
Troubleshooting
| Issue | Solution |
|---|---|
| Token limit 429 | Increase tokens-per-minute or add load balancing |
| No cache hits | Lower score-threshold to 0.7 |
| Content false positives | Increase category thresholds (5-6) |
| Backend auth 401 | Grant APIM "Cognitive Services User" role |
See references/troubleshooting.md for details.
References
- Detailed Policies - Full policy examples
- Configuration Patterns - Step-by-step patterns
- Troubleshooting - Common issues
- AI-Gateway Samples
- GenAI Gateway Docs
SDK Quick References
- Content Safety: Python | TypeScript
- API Management: Python | .NET
Azure의 다른 스킬
azure-ai
Azure
Azure AI: Search, Speech, OpenAI, Document Intelligence에 사용됩니다. 검색, 벡터/하이브리드 검색, 음성-텍스트 변환, 텍스트-음성 변환, 전사, OCR을 지원합니다.
appinsights-instrumentation
Azure
Azure Application Insights를 사용하여 웹앱을 계측하기 위한 가이드입니다. 원격 분석 패턴, SDK 설정 및 구성 참조를 제공합니다.
azure-compliance
Azure
포괄적인 Azure 규정 준수 및 보안 감사 기능으로, 모범 사례 평가, Key Vault 만료 모니터링, 리소스 구성 검증을 포함합니다.
azure-compute
Azure
워크로드 요구 사항, 성능 요구 사항 및 예산 제약 조건에 따라 Azure VM 크기, VM Scale Sets(VMSS) 및 구성을 추천합니다.
azure-cost-optimization
Azure
Azure 구독 전반에서 실제 비용, 사용률 메트릭을 분석하여 비용 절감 기회를 식별하고 정량화하며, 실행 가능한 최적화 권장 사항을 생성합니다.
azure-deploy
Azure
Azure에 배포를 실행합니다. 준비 및 검증 후 최종 단계입니다. azd up, azd deploy 또는 인프라 프로비저닝 명령을 실행합니다.
azure-diagnostics
Azure
Azure에서 프로덕션 문제를 디버깅하고 문제를 해결합니다. Container Apps 및 Function Apps 진단, KQL을 사용한 로그 분석, 상태 확인, 일반적인 문제 해결을 다룹니다.
azure-hosted-copilot-sdk
Azure
GitHub Copilot SDK 앱을 Azure에 빌드하고 배포합니다.