qdrant-deployment-options

por github

Guía la selección de despliegue de Qdrant. Úsalo cuando alguien pregunte 'cómo desplegar Qdrant', 'Docker vs Cloud', 'modo local', 'Qdrant embebido', 'Qdrant EDGE', 'cuál…

npx skills add https://github.com/github/awesome-copilot --skill qdrant-deployment-options

Which Qdrant Deployment Do I Need?

Start with what you need: managed ops or full control? Network latency acceptable or not? Production or prototyping? The answer narrows to one of four options.

Getting Started or Prototyping

Use when: building a prototype, running tests, CI/CD pipelines, or learning Qdrant.

  • Use local mode (Python only): zero-dependency, in-memory or disk-persisted, no server needed Local mode
  • Local mode data format is NOT compatible with server. Do not use for production or benchmarking.
  • For a real server locally, use Docker Quick start

Going to Production (Self-Hosted)

Use when: you need full control over infrastructure, data residency, or custom configuration.

  • Docker is the default deployment. Full Qdrant Open Source feature set, minimal setup. Quick start
  • You own operations: upgrades, backups, scaling, monitoring
  • Must set up distributed mode manually for multi-node clusters Distributed deployment
  • Consider Hybrid Cloud if you want Qdrant Cloud management on your infrastructure Hybrid Cloud

Going to Production (Zero-Ops)

Use when: you want managed infrastructure with zero-downtime updates, automatic backups, and resharding without operating clusters yourself.

  • Qdrant Cloud handles upgrades, scaling, backups, and monitoring Qdrant Cloud
  • Supports multi-version upgrades automatically
  • Provides features not available in self-hosted: /sys_metrics, managed resharding, pre-configured alerts

Need Lowest Possible Latency

Use when: network round-trip to a server is unacceptable. Edge devices, in-process search, or latency-critical applications.

  • Qdrant EDGE: in-process bindings to Qdrant shard-level functions, no network overhead Qdrant EDGE
  • Same data format as server. Can sync with server via shard snapshots.
  • Single-node feature set only. No distributed mode.

What NOT to Do

  • Use local mode for production or benchmarking (not optimized, incompatible data format)
  • Self-host without monitoring and backup strategy (you will lose data or miss outages)
  • Choose EDGE when you need distributed search (single-node only)
  • Pick Hybrid Cloud unless you have data residency requirements (unnecessary Kubernetes complexity when Qdrant Cloud works)

Más skills de github

console-rendering
github
Instrucciones para usar el sistema de renderizado en consola basado en etiquetas de struct en Go
official
acquire-codebase-knowledge
github
Usa esta habilidad cuando el usuario solicite explícitamente mapear, documentar o incorporarse a un código base existente. Actívala para indicaciones como "mapea este código base", "documenta…
official
acreadiness-assess
github
Run the AgentRC readiness assessment on the current repository and produce a static HTML dashboard at reports/index.html. Wraps `npx github:microsoft/agentrc…
official
acreadiness-generate-instructions
github
Genera archivos de instrucciones de agente de IA personalizados mediante el comando de instrucciones de AgentRC. Produce .github/copilot-instructions.md (por defecto, recomendado para Copilot en VS…)
official
acreadiness-policy
github
Ayudar al usuario a seleccionar, redactar o aplicar una política de AgentRC. Las políticas personalizan la puntuación de readiness desactivando comprobaciones irrelevantes, anulando impacto/nivel, estableciendo…
official
add-educational-comments
github
Añade comentarios educativos a archivos de código para convertirlos en recursos de aprendizaje efectivos. Adapta la profundidad y el tono de las explicaciones a tres niveles de conocimiento configurables: principiante, intermedio y avanzado. Solicita automáticamente un archivo si no se proporciona ninguno, con una lista numerada para una selección rápida. Expande los archivos hasta un 125% utilizando solo comentarios educativos (límite estricto: 400 líneas nuevas; 300 para archivos de más de 1,000 líneas). Conserva la codificación del archivo, el estilo de sangría, la corrección sintáctica y...
official
adobe-illustrator-scripting
github
Escribir, depurar y optimizar scripts de automatización de Adobe Illustrator usando ExtendScript (JavaScript/JSX). Úselo al crear o modificar scripts que manipulen…
official
agent-governance
github
Políticas declarativas, clasificación de intenciones y registros de auditoría para controlar el acceso y comportamiento de herramientas de agentes de IA. Las políticas de gobernanza componibles definen herramientas permitidas/bloqueadas, filtros de contenido, límites de velocidad y requisitos de aprobación, almacenados como configuración, no como código. La clasificación semántica de intenciones detecta indicaciones peligrosas (exfiltración de datos, escalada de privilegios, inyección de indicaciones) antes de la ejecución de herramientas mediante señales basadas en patrones. El decorador de gobernanza a nivel de herramienta aplica políticas en funciones...
official