AWS Cost & Operations

bởi zxkane

Kỹ năng này cung cấp các phương pháp tối ưu hóa chi phí, giám sát và vận hành tốt nhất cho AWS với các máy chủ MCP tích hợp để phân tích hóa đơn, ước tính chi phí, quan sát và đánh giá bảo mật.

npx skills add https://github.com/zxkane/aws-skills --skill aws-cost-operations

AWS Cost & Operations

This skill provides comprehensive guidance for AWS cost optimization, monitoring, observability, and operational excellence with integrated MCP servers.

AWS Documentation Requirement

Always verify AWS facts using MCP tools (mcp__aws-mcp__* or mcp__*awsdocs*__*) before answering. The aws-mcp-setup dependency is auto-loaded — if MCP tools are unavailable, guide the user through that skill's setup flow.

Integrated MCP Servers

This plugin provides 3 MCP servers:

Bundled Servers

1. AWS Pricing MCP Server (pricing)

Purpose: Pre-deployment cost estimation and optimization

  • Estimate costs before deploying resources
  • Compare pricing across regions
  • Calculate Total Cost of Ownership (TCO)
  • Evaluate different service options for cost efficiency

2. AWS Cost Explorer MCP Server (costexp)

Purpose: Detailed cost analysis and reporting

  • Analyze historical spending patterns
  • Identify cost anomalies and trends
  • Forecast future costs
  • Analyze cost by service, region, or tag

3. Amazon CloudWatch MCP Server (cw)

Purpose: Metrics, alarms, and logs analysis

  • Query CloudWatch metrics and logs
  • Create and manage CloudWatch alarms
  • Troubleshoot operational issues
  • Monitor resource utilization

Note: The following servers are available separately via the Full AWS MCP Server (see aws-mcp-setup skill) and are not bundled with this plugin:

  • AWS Billing and Cost Management MCP — Real-time billing details
  • CloudWatch Application Signals MCP — APM and SLOs
  • AWS Managed Prometheus MCP — PromQL queries for containers
  • AWS CloudTrail MCP — API activity audit
  • AWS Well-Architected Security Assessment MCP — Security posture assessment

When to Use This Skill

Use this skill when:

  • Optimizing AWS costs and reducing spending
  • Estimating costs before deployment
  • Monitoring application and infrastructure performance
  • Setting up observability and alerting
  • Analyzing spending patterns and trends
  • Investigating operational issues
  • Auditing AWS activity and changes
  • Assessing security posture
  • Implementing operational excellence

Cost Optimization Best Practices

Pre-Deployment Cost Estimation

Always estimate costs before deploying:

  1. Use AWS Pricing MCP to estimate resource costs
  2. Compare pricing across different regions
  3. Evaluate alternative service options
  4. Calculate expected monthly costs
  5. Plan for scaling and growth

Example workflow:

"Estimate the monthly cost of running a Lambda function with
1 million invocations, 512MB memory, 3-second duration in us-east-1"

Cost Analysis and Optimization

Regular cost reviews:

  1. Use Cost Explorer MCP to analyze spending trends
  2. Identify cost anomalies and unexpected charges
  3. Review costs by service, region, and environment
  4. Compare actual vs. budgeted costs
  5. Generate cost optimization recommendations

Cost optimization strategies:

  • Right-size over-provisioned resources
  • Use appropriate storage classes (S3, EBS)
  • Implement auto-scaling for dynamic workloads
  • Leverage Savings Plans and Reserved Instances
  • Delete unused resources and snapshots
  • Use cost allocation tags effectively

Budget Monitoring

Track spending against budgets:

  1. Use Billing and Cost Management MCP to monitor budgets
  2. Set up budget alerts for threshold breaches
  3. Review budget utilization regularly
  4. Adjust budgets based on trends
  5. Implement cost controls and governance

Monitoring and Observability Best Practices

CloudWatch Metrics and Alarms

Implement comprehensive monitoring:

  1. Use CloudWatch MCP to query metrics and logs
  2. Set up alarms for critical metrics:
    • CPU and memory utilization
    • Error rates and latency
    • Queue depths and processing times
    • API gateway throttling
    • Lambda errors and timeouts
  3. Create CloudWatch dashboards for visualization
  4. Use log insights for troubleshooting

Example alarm scenarios:

  • Lambda error rate > 1%
  • EC2 CPU utilization > 80%
  • API Gateway 4xx/5xx error spike
  • DynamoDB throttled requests
  • ECS task failures

Application Performance Monitoring

Monitor application health:

  1. Use CloudWatch Application Signals MCP for APM
  2. Track service-level objectives (SLOs)
  3. Monitor application dependencies
  4. Identify performance bottlenecks
  5. Set up distributed tracing

Container and Kubernetes Monitoring

For containerized workloads:

  1. Use AWS Managed Prometheus MCP for metrics
  2. Monitor container resource utilization
  3. Track pod and node health
  4. Create PromQL queries for custom metrics
  5. Set up alerts for container anomalies

Audit and Security Best Practices

CloudTrail Activity Analysis

Audit AWS activity:

  1. Use CloudTrail MCP to analyze API activity
  2. Track who made changes to resources
  3. Investigate security incidents
  4. Monitor for suspicious activity patterns
  5. Audit compliance with policies

Common audit scenarios:

  • "Who deleted this S3 bucket?"
  • "Show all IAM role changes in the last 24 hours"
  • "List failed login attempts"
  • "Find all actions by a specific user"
  • "Track modifications to security groups"

Security Assessment

Regular security reviews:

  1. Use Well-Architected Security Assessment MCP
  2. Assess security posture against best practices
  3. Identify security gaps and vulnerabilities
  4. Implement recommended security improvements
  5. Document security compliance

Security assessment areas:

  • Identity and Access Management (IAM)
  • Detective controls and monitoring
  • Infrastructure protection
  • Data protection and encryption
  • Incident response preparedness

Using MCP Servers Effectively

Cost Analysis Workflow

  1. Pre-deployment: Use Pricing MCP to estimate costs
  2. Post-deployment: Use Billing MCP to track actual spending
  3. Analysis: Use Cost Explorer MCP for detailed cost analysis
  4. Optimization: Implement recommendations from Cost Explorer

Monitoring Workflow

  1. Setup: Configure CloudWatch metrics and alarms
  2. Monitor: Use CloudWatch MCP to track key metrics
  3. Analyze: Use Application Signals for APM insights
  4. Troubleshoot: Query CloudWatch Logs for issue resolution

Security Workflow

  1. Audit: Use CloudTrail MCP to review activity
  2. Assess: Use Well-Architected Security Assessment
  3. Remediate: Implement security recommendations
  4. Monitor: Track security events via CloudWatch

MCP Usage Best Practices

  1. Cost Awareness: Check pricing before deploying resources
  2. Proactive Monitoring: Set up alarms for critical metrics
  3. Regular Reviews: Analyze costs and performance weekly
  4. Audit Trails: Review CloudTrail logs for compliance
  5. Security First: Run security assessments regularly
  6. Optimize Continuously: Act on cost and performance recommendations

Operational Excellence Guidelines

Cost Optimization

  • Tag Everything: Use consistent cost allocation tags
  • Review Monthly: Analyze spending trends and anomalies
  • Right-size: Match resources to actual usage
  • Automate: Use auto-scaling and scheduling
  • Monitor Budgets: Set alerts for cost overruns

Monitoring and Alerting

  • Critical Metrics: Alert on business-critical metrics
  • Noise Reduction: Fine-tune thresholds to reduce false positives
  • Actionable Alerts: Ensure alerts have clear remediation steps
  • Dashboard Visibility: Create dashboards for key stakeholders
  • Log Retention: Balance cost and compliance needs

Security and Compliance

  • Least Privilege: Grant minimum required permissions
  • Audit Regularly: Review CloudTrail logs for anomalies
  • Encrypt Data: Use encryption at rest and in transit
  • Assess Continuously: Run security assessments frequently
  • Incident Response: Have procedures for security events

Additional Resources

For detailed operational patterns and best practices, refer to the comprehensive reference:

File: references/operations-patterns.md

This reference includes:

  • Cost optimization strategies
  • Monitoring and alerting patterns
  • Observability best practices
  • Security and compliance guidelines
  • Troubleshooting workflows

CloudWatch Alarms Reference

File: references/cloudwatch-alarms.md

Common alarm configurations for:

  • Lambda functions
  • EC2 instances
  • RDS databases
  • DynamoDB tables
  • API Gateway
  • ECS services
  • Application Load Balancers

Skills liên quan

generate-custom-instructions-from-codebase
github
Tạo hướng dẫn di chuyển GitHub Copilot bằng cách phân tích sự khác biệt mã giữa các phiên bản dự án. So sánh hai trạng thái dự án (nhánh, commit hoặc thẻ) để trích xuất các mẫu chuyển đổi, thay đổi API và thay đổi kiến trúc. Tạo tệp .github/copilot-migration-instructions.md với các quy tắc bắt buộc, các chuyển đổi đã xác thực, tương ứng API và các mẫu lỗi thời cần tránh. Hỗ trợ nhiều loại di chuyển: nâng cấp phiên bản framework, tái cấu trúc kiến trúc, công nghệ...
official
parent-project-skills
cloudflare
Kỹ năng khởi tạo để khám phá các kỹ năng bổ sung và ngữ cảnh từ một dự án cha khi workerd được sử dụng như một mô-đun con. Tải kỹ năng này khi các tác vụ trải dài…
official
imagegen-frontend-mobile
leonxlnx
Kỹ năng tạo hình ảnh ứng dụng di động cao cấp dành cho việc xây dựng các khái niệm và luồng màn hình gốc ứng dụng. Được thiết kế cho các sản phẩm di động iOS, Android và đa nền tảng. Ưu tiên phân cấp rõ ràng, văn bản dễ đọc, tính nhất quán mạnh mẽ giữa các màn hình, bảng màu được kiểm soát, định hướng sáng tạo không chung chung, bề mặt có kết cấu, bố cục dẫn dắt bằng hình ảnh, biểu tượng tùy chỉnh tinh tế và khung điện thoại mô phỏng sạch sẽ. Theo mặc định, màn hình nên được hiển thị bên trong khung iPhone cao cấp t
creativedesign
sentry-setup-tracing
sentry
Setup Sentry Tracing (Performance Monitoring) in any project. Use when asked to enable tracing, track transactions/spans, measure latency, or add performance…
official
Slack Gif Creator
Anthropic
Bộ công cụ tạo ảnh động GIF được tối ưu cho Slack, kèm trình xác thực giới hạn kích thước và các thành phần hoạt ảnh có thể kết hợp. Kỹ năng này được áp dụng khi người dùng yêu cầu ảnh động GIF hoặc hoạt ảnh biểu tượng cảm xúc cho Slack qua các mô tả như "tạo cho tôi một GIF cho Slack về X đang làm Y". giấy phép: Điều khoản đầy đủ trong LICENSE.txt
creativeofficial
update-markdown-file-index
github
Tạo và duy trì chỉ mục tệp trong tài liệu markdown bằng cách quét thư mục và cập nhật hoặc tạo danh sách tệp có tổ chức. Quét các tệp markdown mục tiêu và phát hiện các tệp khớp với mẫu đã chỉ định trong các thư mục được chỉ định. Tạo ba tùy chọn định dạng bảng: danh sách đơn giản có mô tả, bảng chi tiết có siêu dữ liệu loại/kích thước, hoặc các phần phân loại theo nhóm loại tệp. Tự động xác định các phần chỉ mục hiện có bằng mẫu tiêu đề ("index", "files", "contents") và cập nhật...
official
pitch-deck
anthropic
Điền dữ liệu từ các tệp nguồn vào các mẫu pitch deck ngân hàng đầu tư. Sử dụng khi: người dùng cung cấp mẫu PowerPoint để điền, người dùng có dữ liệu nguồn…
official
reviewing-dependencies
bitwarden
Kỹ năng này nên được sử dụng khi người dùng yêu cầu "xem xét các cảnh báo Dependabot", "kiểm tra các phụ thuộc dễ bị tổn thương", "kiểm toán các gói bên thứ ba", "đánh giá chuỗi cung ứng…
official