azure-aigateway

tarafından microsoft

Azure API Management'ı AI modelleri, MCP araçları ve aracılar için bir AI Ağ Geçidi olarak yapılandırın. NE ZAMAN: anlamsal önbellekleme, token sınırı, içerik güvenliği, yük dengeleme, AI model yönetimi, MCP hız sınırlama, jailbreak tespiti, Azure OpenAI arka ucu ekleme, AI Foundry modeli ekleme, AI ağ geçidini test etme, LLM politikaları, AI arka ucunu yapılandırma, token metrikleri, AI maliyet kontrolü, API'yi MCP'ye dönüştürme, OpenAPI'yi ağ geçidine aktarma.

npx skills add https://github.com/microsoft/azure-skills --skill azure-aigateway

Azure AI Gateway

Configure Azure API Management (APIM) as an AI Gateway for governing AI models, MCP tools, and agents.

To deploy APIM, use the azure-prepare skill. See APIM deployment guide.

When to Use This Skill

CategoryTriggers
Model Governance"semantic caching", "token limits", "load balance AI", "track token usage"
Tool Governance"rate limit MCP", "protect my tools", "configure my tool", "convert API to MCP"
Agent Governance"content safety", "jailbreak detection", "filter harmful content"
Configuration"add Azure OpenAI backend", "configure my model", "add AI Foundry model"
Testing"test AI gateway", "call OpenAI through gateway"

Quick Reference

PolicyPurposeDetails
azure-openai-token-limitCost controlModel Policies
azure-openai-semantic-cache-lookup/store60-80% cost savingsModel Policies
azure-openai-emit-token-metricObservabilityModel Policies
llm-content-safetySafety & complianceAgent Policies
rate-limit-by-keyMCP/tool protectionTool Policies

Get Gateway Details

# Get gateway URL
az apim show --name <apim-name> --resource-group <rg> --query "gatewayUrl" -o tsv

# List backends (AI models)
az apim backend list --service-name <apim-name> --resource-group <rg> \
  --query "[].{id:name, url:url}" -o table

# Get subscription key
az apim subscription keys list \
  --service-name <apim-name> --resource-group <rg> --subscription-id <sub-id>

Test AI Endpoint

GATEWAY_URL=$(az apim show --name <apim-name> --resource-group <rg> --query "gatewayUrl" -o tsv)

curl -X POST "${GATEWAY_URL}/openai/deployments/<deployment>/chat/completions?api-version=2024-02-01" \
  -H "Content-Type: application/json" \
  -H "Ocp-Apim-Subscription-Key: <key>" \
  -d '{"messages": [{"role": "user", "content": "Hello"}], "max_tokens": 100}'

Common Tasks

Add AI Backend

See references/patterns.md for full steps.

# Discover AI resources
az cognitiveservices account list --query "[?kind=='OpenAI']" -o table

# Create backend
az apim backend create --service-name <apim> --resource-group <rg> \
  --backend-id openai-backend --protocol http --url "https://<aoai>.openai.azure.com/openai"

# Grant access (managed identity)
az role assignment create --assignee <apim-principal-id> \
  --role "Cognitive Services User" --scope <aoai-resource-id>

Apply AI Governance Policy

Recommended policy order in <inbound>:

  1. Authentication - Managed identity to backend
  2. Semantic Cache Lookup - Check cache before calling AI
  3. Token Limits - Cost control
  4. Content Safety - Filter harmful content
  5. Backend Selection - Load balancing
  6. Metrics - Token usage tracking

See references/policies.md for complete example.


Troubleshooting

IssueSolution
Token limit 429Increase tokens-per-minute or add load balancing
No cache hitsLower score-threshold to 0.7
Content false positivesIncrease category thresholds (5-6)
Backend auth 401Grant APIM "Cognitive Services User" role

See references/troubleshooting.md for details.


References

SDK Quick References

microsoft tarafından daha fazla skill

oss-growth
microsoft
OSS büyüme korsanı kişiliği
official
microsoft-foundry
microsoft
Foundry ajanlarını uçtan uca dağıtın, değerlendirin ve yönetin: Docker build, ACR push, barındırılan/prompt ajan oluşturma, konteyner başlatma, toplu değerlendirme, sürekli değerlendirme, prompt optimizer iş akışları, agent.yaml, izlerden veri kümesi oluşturma. ŞUNUN İÇİN KULLANIN: ajanı Foundry'ye dağıtma, barındırılan ajan, ajan oluşturma, ajanı çağırma, ajanı değerlendirme, toplu değerlendirme çalıştırma, sürekli değerlendirme, sürekli izleme, sürekli değerlendirme durumu, prompt optimize etme, prompt iyileştirme, prompt optimizer
officialdevelopmentdevops
azure-ai
microsoft
Azure AI için kullanılır: Arama, Konuşma, OpenAI, Belge Zekası. Arama, vektör/karma arama, konuşmadan metne, metinden konuşmaya, transkripsiyon, OCR konularında yardımcı olur. NE ZAMAN: AI Arama, sorgu arama, vektör arama, karma arama, anlamsal arama, konuşmadan metne, metinden konuşmaya, transkribe etme, OCR, metni konuşmaya dönüştürme.
officialdevelopmentapi
azure-deploy
microsoft
Halihazırda .azure/deployment-plan.md ve altyapı dosyaları bulunan, ÖNCEDEN HAZIRLANMIŞ uygulamalar için Azure dağıtımlarını gerçekleştirir. Kullanıcı yeni bir uygulama OLUŞTURMAK istediğinde bu beceriyi KULLANMAYIN — bunun yerine azure-prepare kullanın. Bu beceri, yerleşik hata kurtarma ile azd up, azd deploy, terraform apply ve az deployment komutlarını çalıştırır. azure-prepare'dan .azure/deployment-plan.md ve azure-validate'dan onaylanmış durum gerektirir. NE ZAMAN: "azd up çalıştır", "azd deploy çalıştır", "dağıtımı gerçekleştir",...
officialdevopsaws
azure-storage
microsoft
Azure Storage Services dahil olmak üzere Blob Storage, File Shares, Queue Storage, Table Storage ve Data Lake. Depolama erişim katmanları (hot, cool, cold, archive), her katmanın ne zaman kullanılacağı ve katman karşılaştırması hakkında soruları yanıtlar. Nesne depolama, SMB dosya paylaşımları, eşzamansız mesajlaşma, NoSQL anahtar-değer ve büyük veri analitiği sağlar. Yaşam döngüsü yönetimini içerir. KULLANIM AMACI: blob depolama, dosya paylaşımları, kuyruk depolama, tablo depolama, data lake, dosya yükleme, blob indirme, depolama hesapları, erişim katmanları,...
officialdevelopmentdatabase
azure-diagnostics
microsoft
Azure üretim sorunlarını AppLens, Azure Monitor, kaynak durumu ve güvenli triyaj kullanarak hata ayıklayın. NE ZAMAN: üretim sorunlarını hata ayıklama, uygulama servisini sorun giderme, uygulama servisi yüksek CPU, uygulama servisi dağıtım hatası, konteyner uygulamalarını sorun giderme, işlevleri sorun giderme, AKS sorun giderme, kubectl bağlanamıyor, kube-system/CoreDNS hataları, pod beklemede, crashloop, düğüm hazır değil, yükseltme hataları, günlükleri analiz etme, KQL, içgörüler, görüntü çekme hataları, soğuk başlatma sorunları, durum yoklaması
officialdevopsdevelopment
azure-prepare
microsoft
Azure uygulamalarını dağıtıma hazırlayın (altyapı Bicep/Terraform, azure.yaml, Dockerfiles). Oluşturma/modernize etme veya oluşturma+dağıtma için kullanın; çapraz bulut geçişi için kullanmayın (azure-cloud-migrate kullanın). ŞUNLAR İÇİN KULLANMAYIN: copilot-sdk uygulamaları (azure-hosted-copilot-sdk kullanın). ŞU DURUMLARDA: "uygulama oluştur", "web uygulaması oluştur", "API oluştur", "sunucusuz HTTP API oluştur", "ön uç oluştur", "arka uç oluştur", "hizmet oluştur", "uygulamayı modernize et", "uygulamayı güncelle",
officialdevelopmentdevops
azure-validate
microsoft
Azure dağıtım öncesi hazırlık doğrulaması. Dağıtım öncesinde yapılandırma, altyapı (Bicep veya Terraform), RBAC rol atamaları, yönetilen kimlik izinleri ve ön koşullar üzerinde derin kontroller gerçekleştirir. NE ZAMAN: uygulamamı doğrula, dağıtım hazırlığını kontrol et, ön kontrolleri çalıştır, yapılandırmayı doğrula, dağıtıma hazır olup olmadığını kontrol et, azure.yaml dosyasını doğrula, Bicep'i doğrula, dağıtım öncesi test et, dağıtım hatalarını gider, Azure Functions'ı doğrula, function uygulamasını doğrula, sunucusuz do
officialdevopstesting