azure-diagnostics

Отладка проблем Azure в рабочей среде с помощью AppLens, Azure Monitor, работоспособности ресурсов и безопасной триаж. КОГДА: отладка проблем в рабочей среде, устранение неполадок службы приложений, высокая загрузка ЦП службы приложений, сбой развертывания службы приложений, устранение неполадок контейнерных приложений, устранение неполадок функций, устранение неполадок AKS, kubectl не может подключиться, сбои kube-system/CoreDNS, pod в состоянии ожидания, crashloop, узел не готов, сбои обновления, анализ журналов, KQL, аналитика, сбои извлечения образов, проблемы холодного запуска, сбои проверки работоспособности,...

npx skills add https://github.com/microsoft/azure-skills --skill azure-diagnostics

Azure Diagnostics

AUTHORITATIVE GUIDANCE — MANDATORY COMPLIANCE

This document is the official source for debugging and troubleshooting Azure production issues. Follow these instructions to diagnose and resolve common Azure service problems systematically.

Triggers

Activate this skill when user wants to:

  • Debug or troubleshoot production issues
  • Diagnose errors in Azure services
  • Analyze application logs or metrics
  • Fix image pull, cold start, or health probe issues
  • Investigate why Azure resources are failing
  • Find root cause of application errors
  • Troubleshoot App Service issues (high CPU, deployment failures, crashes, slow responses, TLS/custom domains)
  • Respond to prompts like "troubleshoot app service", "app service high CPU", or "app service deployment failure"
  • Troubleshoot Azure Function Apps (invocation failures, timeouts, binding errors)
  • Find the App Insights or Log Analytics workspace linked to a Function App
  • Troubleshoot AKS clusters, nodes, pods, ingress, or Kubernetes networking issues
  • Troubleshoot Azure Messaging SDK issues (Event Hubs, Service Bus connection failures, AMQP errors, message lock issues)

Rules

  1. Start with systematic diagnosis flow
  2. Use AppLens (MCP) for AI-powered diagnostics when available
  3. Check resource health before deep-diving into logs
  4. Select appropriate troubleshooting guide based on service type
  5. Document findings and attempted remediation steps
  6. Route AKS incidents to the dedicated AKS troubleshooting document

Quick Diagnosis Flow

  1. Identify symptoms - What's failing?
  2. Check resource health - Is Azure healthy?
  3. Review logs - What do logs show?
  4. Analyze metrics - Performance patterns?
  5. Investigate recent changes - What changed?

Troubleshooting Guides by Service

ServiceCommon IssuesReference
Container AppsImage pull failures, cold starts, health probes, port mismatchescontainer-apps/
App ServiceHigh CPU, deployment failures, crashes, slow responses, TLS/custom domainsapp-service/
Function AppsApp details, invocation failures, timeouts, binding errors, cold starts, missing app settingsfunctions/
AKSCluster access, nodes, kube-system, scheduling, crash loops, ingress, DNS, upgradesAKS Troubleshooting
MessagingEvent Hubs & Service Bus SDK errors, AMQP failures, message lock, connectivityMessaging Troubleshooting

Routing

  • Keep Container Apps and Function Apps diagnostics in this parent skill.
  • Route active AKS incidents, AKS-specific intake, evidence gathering, and remediation guidance to AKS Troubleshooting.
  • Route Azure Messaging SDK troubleshooting (Event Hubs, Service Bus) to Messaging Troubleshooting.

Quick Reference

Common Diagnostic Commands

# Check resource health
az resource show --ids RESOURCE_ID
# View activity log
az monitor activity-log list -g RG --max-events 20
# Container Apps logs
az containerapp logs show --name APP -g RG --follow
# Function App logs (query App Insights traces)
az monitor app-insights query --apps APP-INSIGHTS -g RG \
  --analytics-query "traces | where timestamp > ago(1h) | order by timestamp desc | take 50"

AppLens (MCP Tools)

For AI-powered diagnostics, use:

mcp_azure_mcp_applens
  intent: "diagnose issues with <resource-name>"
  command: "diagnose"
  parameters:
    resourceId: "<resource-id>"

Provides:
- Automated issue detection
- Root cause analysis
- Remediation recommendations

Azure Monitor (MCP Tools)

For querying logs and metrics:

mcp_azure_mcp_monitor
  intent: "query logs for <resource-name>"
  command: "logs_query"
  parameters:
    workspaceId: "<workspace-id>"
    query: "<KQL-query>"

See kql-queries.md for common diagnostic queries.


Check Azure Resource Health

Using MCP

mcp_azure_mcp_resourcehealth
  intent: "check health status of <resource-name>"
  command: "get"
  parameters:
    resourceId: "<resource-id>"

Using CLI

# Check specific resource health
az resource show --ids RESOURCE_ID

# Check recent activity
az monitor activity-log list -g RG --max-events 20

References

Больше skills от microsoft

oss-growth
microsoft
Персона OSS-хакера роста
official
microsoft-foundry
microsoft
Развёртывание, оценка и управление агентами Foundry «под ключ»: сборка Docker, отправка в ACR, создание хостируемых и промпт-агентов, запуск контейнера, пакетная оценка, непрерывная оценка, оптимизатор промптов, agent.yaml, курирование датасетов из трейсов. ИСПОЛЬЗУЙТЕ ДЛЯ: развёртывания агента в Foundry, хостируемого агента, создания агента, вызова агента, оценки агента, запуска пакетной оценки, непрерывной оценки, непрерывного мониторинга, статуса непрерывной оценки, оптимизации промпта, улучшения промпта, оптимизатора промптов, оптимизации инструкций агента, улучшения агента...
officialdevelopmentdevops
azure-ai
microsoft
Используется для Azure AI: поиск, речь, OpenAI, анализ документов. Помогает с поиском, векторным/гибридным поиском, преобразованием речи в текст, синтезом речи, транскрипцией, OCR. КОГДА: AI Search, поиск по запросу, векторный поиск, гибридный поиск, семантический поиск, преобразование речи в текст, синтез речи, транскрибирование, OCR, преобразование текста в речь.
officialdevelopmentapi
azure-deploy
microsoft
Выполнение развертываний Azure для УЖЕ ПОДГОТОВЛЕННЫХ приложений, имеющих существующие файлы .azure/deployment-plan.md и инфраструктуры. НЕ используйте этот навык, когда пользователь просит СОЗДАТЬ новое приложение — используйте azure-prepare. Этот навык выполняет команды azd up, azd deploy, terraform apply и az deployment со встроенным восстановлением после ошибок. Требует .azure/deployment-plan.md от azure-prepare и подтвержденный статус от azure-validate. КОГДА: "запустить azd up", "запустить azd deploy", "выполнить развертывание",...
officialdevopsaws
azure-storage
microsoft
Сервисы Azure Storage, включая Blob Storage, File Shares, Queue Storage, Table Storage и Data Lake. Отвечает на вопросы об уровнях доступа к хранилищу (горячий, холодный, холодный, архивный), когда использовать каждый уровень и сравнение уровней. Предоставляет объектное хранилище, SMB-файловые ресурсы, асинхронный обмен сообщениями, NoSQL-ключ-значение и аналитику больших данных. Включает управление жизненным циклом. ИСПОЛЬЗОВАТЬ ДЛЯ: хранилища BLOB-объектов, файловых ресурсов, хранилища очередей, табличного хранилища, Data Lake, загрузки файлов, скачивания BLOB-объектов, учетных записей хранения, уровней доступа,...
officialdevelopmentdatabase
azure-prepare
microsoft
Подготовка приложений Azure к развертыванию (инфра Bicep/Terraform, azure.yaml, Dockerfiles). Используйте для создания/модернизации или создания+развертывания; не для межоблачной миграции (используйте azure-cloud-migrate). НЕ ИСПОЛЬЗУЙТЕ ДЛЯ: приложений copilot-sdk (используйте azure-hosted-copilot-sdk). КОГДА: "создать приложение", "создать веб-приложение", "создать API", "создать бессерверный HTTP API", "создать фронтенд", "создать бэкенд", "собрать сервис", "модернизировать приложение", "обновить приложение", "добавить аутентификацию", "добавить кэширование", "разместить в Azure", "создать и...
officialdevelopmentdevops
azure-validate
microsoft
Предварительная проверка развертывания на готовность Azure. Выполняет глубокие проверки конфигурации, инфраструктуры (Bicep или Terraform), назначений ролей RBAC, разрешений управляемых удостоверений и предварительных требований перед развертыванием. КОГДА: проверить мое приложение, проверить готовность к развертыванию, выполнить предварительные проверки, проверить конфигурацию, проверить готовность к развертыванию, проверить azure.yaml, проверить Bicep, протестировать перед развертыванием, устранить ошибки развертывания, проверить Azure Functions, проверить приложение-функцию, проверить бессерверное...
officialdevopstesting
entra-app-registration
microsoft
Руководство по регистрации приложений Microsoft Entra ID, аутентификации OAuth 2.0 и интеграции MSAL. ИСПОЛЬЗОВАТЬ ДЛЯ: создания регистрации приложения, регистрации приложения Azure AD, настройки OAuth, настройки аутентификации, добавления разрешений API, создания субъекта-службы, примера MSAL, аутентификации консольного приложения, настройки Entra ID, аутентификации Azure AD. НЕ ИСПОЛЬЗОВАТЬ ДЛЯ: Azure RBAC или назначения ролей (используйте azure-rbac), секретов Key Vault (используйте azure-keyvault-expiration-audit), общих рекомендаций по безопасности ресурсов Azure.
officialdevelopmentapi