azure-aigateway

โดย Azure

กำหนดค่า Azure API Management (APIM) เป็น AI Gateway เพื่อรักษาความปลอดภัย สังเกตการณ์ ควบคุมโมเดล AI, MCP servers, agents ช่วยในการจำกัดอัตราการใช้งาน, การแคชเชิงความหมาย, ความปลอดภัยของเนื้อหา, การปรับสมดุลโหลด

npx skills add https://github.com/microsoft/GitHub-Copilot-for-Azure --skill azure-aigateway

Azure AI Gateway

Configure Azure API Management (APIM) as an AI Gateway for governing AI models, MCP tools, and agents.

To deploy APIM, use the azure-prepare skill. See APIM deployment guide.

When to Use This Skill

CategoryTriggers
Model Governance"semantic caching", "token limits", "load balance AI", "track token usage"
Tool Governance"rate limit MCP", "protect my tools", "configure my tool", "convert API to MCP"
Agent Governance"content safety", "jailbreak detection", "filter harmful content"
Configuration"add Azure OpenAI backend", "configure my model", "add AI Foundry model"
Testing"test AI gateway", "call OpenAI through gateway"

Quick Reference

PolicyPurposeDetails
azure-openai-token-limitCost controlModel Policies
azure-openai-semantic-cache-lookup/store60-80% cost savingsModel Policies
azure-openai-emit-token-metricObservabilityModel Policies
llm-content-safetySafety & complianceAgent Policies
rate-limit-by-keyMCP/tool protectionTool Policies

Get Gateway Details

# Get gateway URL
az apim show --name <apim-name> --resource-group <rg> --query "gatewayUrl" -o tsv

# List backends (AI models)
az apim backend list --service-name <apim-name> --resource-group <rg> \
  --query "[].{id:name, url:url}" -o table

# Get subscription key
az apim subscription keys list \
  --service-name <apim-name> --resource-group <rg> --subscription-id <sub-id>

Test AI Endpoint

GATEWAY_URL=$(az apim show --name <apim-name> --resource-group <rg> --query "gatewayUrl" -o tsv)

curl -X POST "${GATEWAY_URL}/openai/deployments/<deployment>/chat/completions?api-version=2024-02-01" \
  -H "Content-Type: application/json" \
  -H "Ocp-Apim-Subscription-Key: <key>" \
  -d '{"messages": [{"role": "user", "content": "Hello"}], "max_tokens": 100}'

Common Tasks

Add AI Backend

See references/patterns.md for full steps.

# Discover AI resources
az cognitiveservices account list --query "[?kind=='OpenAI']" -o table

# Create backend
az apim backend create --service-name <apim> --resource-group <rg> \
  --backend-id openai-backend --protocol http --url "https://<aoai>.openai.azure.com/openai"

# Grant access (managed identity)
az role assignment create --assignee <apim-principal-id> \
  --role "Cognitive Services User" --scope <aoai-resource-id>

Apply AI Governance Policy

Recommended policy order in <inbound>:

  1. Authentication - Managed identity to backend
  2. Semantic Cache Lookup - Check cache before calling AI
  3. Token Limits - Cost control
  4. Content Safety - Filter harmful content
  5. Backend Selection - Load balancing
  6. Metrics - Token usage tracking

See references/policies.md for complete example.


Troubleshooting

IssueSolution
Token limit 429Increase tokens-per-minute or add load balancing
No cache hitsLower score-threshold to 0.7
Content false positivesIncrease category thresholds (5-6)
Backend auth 401Grant APIM "Cognitive Services User" role

See references/troubleshooting.md for details.


References

SDK Quick References

Skills เพิ่มเติมจาก Azure

azure-ai
Azure
ใช้สำหรับ Azure AI: Search, Speech, OpenAI, Document Intelligence ช่วยในการค้นหา, การค้นหาแบบเวกเตอร์/ไฮบริด, การแปลงคำพูดเป็นข้อความ, การแปลงข้อความเป็นคำพูด, การถอดเสียง, OCR
appinsights-instrumentation
Azure
แนวทางสำหรับการติดตั้งเครื่องมือวัด (instrumentation) ให้กับเว็บแอปพลิเคชันด้วย Azure Application Insights ให้รูปแบบการส่งข้อมูลเทเลเมทรี การตั้งค่า SDK และข้อมูลอ้างอิงการกำหนดค่า
azure-compliance
Azure
ความสามารถในการตรวจสอบการปฏิบัติตามข้อกำหนดและความปลอดภัยของ Azure อย่างครอบคลุม รวมถึงการประเมินแนวทางปฏิบัติที่ดีที่สุด การตรวจสอบวันหมดอายุของ Key Vault และการตรวจสอบความถูกต้องของการกำหนดค่าทรัพยากร
azure-compute
Azure
แนะนำขนาด VM ของ Azure, VM Scale Sets (VMSS) และการกำหนดค่าตามความต้องการของเวิร์กโหลด ความต้องการด้านประสิทธิภาพ และข้อจำกัดด้านงบประมาณ
azure-cost-optimization
Azure
ระบุและวัดปริมาณการประหยัดต้นทุนในทุกการสมัครใช้งาน Azure โดยการวิเคราะห์ต้นทุนจริง เมตริกการใช้งาน และสร้างคำแนะนำการปรับแต่งที่สามารถดำเนินการได้
azure-deploy
Azure
ดำเนินการปรับใช้ไปยัง Azure ขั้นตอนสุดท้ายหลังจากการเตรียมการและการตรวจสอบ ทำงานคำสั่ง azd up, azd deploy หรือการจัดเตรียมโครงสร้างพื้นฐาน
azure-diagnostics
Azure
ดีบักและแก้ไขปัญหาการทำงานจริงบน Azure ครอบคลุมการวินิจฉัย Container Apps และ Function Apps การวิเคราะห์บันทึกด้วย KQL การตรวจสอบสถานะ และการแก้ไขปัญหาทั่วไป
azure-hosted-copilot-sdk
Azure
สร้างและปรับใช้แอป GitHub Copilot SDK ไปยัง Azure