tavily-map

Descubrimiento rápido de URL en sitios web sin extraer contenido, ideal para encontrar páginas específicas en sitios grandes. Devuelve listas estructuradas de todas las URL en un dominio con profundidad y amplitud configurables, filtrado de rutas mediante expresiones regulares e instrucciones en lenguaje natural para filtrado semántico. Admite control de profundidad (1–5 niveles), límites de amplitud por página, inclusión/exclusión de enlaces externos y filtrado de dominios mediante patrones regex. Diseñado como paso 1 en un flujo de trabajo: mapear para encontrar la página correcta, luego usar extract o...

npx skills add https://github.com/tavily-ai/skills --skill tavily-map

tavily map

Discover URLs on a website without extracting content. Faster than crawling.

Before running any command

If tvly is not found on PATH, install it first:

curl -fsSL https://cli.tavily.com/install.sh | bash && tvly login

Do not skip this step or fall back to other tools.

See tavily-cli for alternative install methods and auth options.

When to use

  • You need to find a specific subpage on a large site
  • You want a list of all URLs before deciding what to extract or crawl
  • Step 3 in the workflow: search → extract → map → crawl → research

Quick start

# Discover all URLs
tvly map "https://docs.example.com" --json

# With natural language filtering
tvly map "https://docs.example.com" --instructions "Find API docs and guides" --json

# Filter by path
tvly map "https://example.com" --select-paths "/blog/.*" --limit 500 --json

# Deep map
tvly map "https://example.com" --max-depth 3 --limit 200 --json

Options

OptionDescription
--max-depthLevels deep (1-5, default: 1)
--max-breadthLinks per page (default: 20)
--limitMax URLs to discover (default: 50)
--instructionsNatural language guidance for URL filtering
--select-pathsComma-separated regex patterns to include
--exclude-pathsComma-separated regex patterns to exclude
--select-domainsComma-separated regex for domains to include
--exclude-domainsComma-separated regex for domains to exclude
--allow-external / --no-externalInclude external links
--timeoutMax wait (10-150 seconds)
-o, --outputSave output to file
--jsonStructured JSON output

Map + Extract pattern

Use map to find the right page, then extract it. This is often more efficient than crawling an entire site:

# Step 1: Find the authentication docs
tvly map "https://docs.example.com" --instructions "authentication" --json

# Step 2: Extract the specific page you found
tvly extract "https://docs.example.com/api/authentication" --json

Tips

  • Map is URL discovery only — no content extraction. Use extract or crawl for content.
  • Map + extract beats crawl when you only need a few specific pages from a large site.
  • Use --instructions for semantic filtering when path patterns aren't enough.

See also

Más skills de tavily-ai

crawl
tavily-ai
Extrae y guarda el contenido de sitios web como archivos markdown para acceso y análisis sin conexión. Admite profundidad de rastreo configurable (1-5 niveles), límites de amplitud y topes de páginas para equilibrar la cobertura con el rendimiento. Incluye filtrado de rutas mediante patrones regex para enfocarse en secciones específicas y excluir contenido irrelevante. Ofrece dos modos: extracción de página completa para recopilación de datos, o fragmentación semántica con instrucciones en lenguaje natural para alimentar resultados en el contexto de un LLM. Proporciona una API de mapa complementaria para URL...
official
extract
tavily-ai
Extrae contenido limpio de URLs específicas usando la API de extracción de Tavily. Admite hasta 20 URLs por solicitud con reordenamiento opcional basado en consultas para enfocarse en fragmentos de contenido relevantes. Dos modos de extracción: básico para extracción rápida de texto, avanzado para páginas renderizadas con JavaScript y datos estructurados. Autenticación automática OAuth mediante navegador en la primera ejecución, o configuración manual de clave API en ajustes. Devuelve formato markdown o texto plano con URLs de imágenes opcionales y tiempo de espera configurable de hasta 60 segundos.
official
research
tavily-ai
Investigación exhaustiva sobre cualquier tema con recopilación automática de fuentes, análisis y citas. Realiza investigación web de múltiples fuentes con citas explícitas, ideal para comparaciones, eventos actuales, análisis de mercado e informes detallados. Ofrece tres opciones de modelo: mini para investigación dirigida de un solo tema (~30s), pro para análisis integral de múltiples ángulos (~60-120s) y auto para detección de complejidad impulsada por API. Se autentica mediante OAuth a través del servidor MCP de Tavily con inicio de sesión automático basado en navegador en...
official
search
tavily-ai
Búsqueda web con resultados optimizados para LLM, puntuación de relevancia y filtrado flexible. Compatible con cuatro modos de profundidad de búsqueda (ultrarrápido, rápido, básico, avanzado) con compensaciones configurables entre latencia y relevancia. Incluye filtrado por dominio, restricciones de rango temporal, rangos de fechas, priorización por país y extracción de contenido sin procesar. Devuelve resultados con título, URL, fragmento de contenido y puntuación de relevancia; resultados de imágenes opcionales y favicons. Autenticación OAuth automática a través del servidor MCP de Tavily o configuración de clave API;...
official
tavily-best-practices
tavily-ai
API de búsqueda web para LLMs con acceso a datos en tiempo real, extracción de contenido, rastreo de sitios e investigación impulsada por IA. Cinco métodos principales: search() para resultados web, extract() para contenido de URL, crawl() para extracción en todo el sitio, map() para descubrimiento de URL y research() para síntesis de IA de extremo a extremo. Compatible con SDKs de Python y JavaScript con clientes asíncronos para consultas paralelas y profundidad de búsqueda configurable (ultra-rápida/rápida/básica/avanzada). El método crawl acepta instrucciones semánticas para enfocar la extracción en...
official
tavily-cli
tavily-ai
Búsqueda web, extracción de contenido, rastreo de sitios e investigación profunda a través de Tavily CLI. Cinco modos de comando que cubren búsqueda, extracción, descubrimiento de URL, rastreo masivo e investigación multifuente con citas. Todos los comandos admiten salida JSON y guardado en archivos para flujos de trabajo estructurados y agentivos. Un patrón de escalamiento te guía desde la búsqueda simple hasta la extracción, mapeo, rastreo e investigación exhaustiva según tus necesidades. Requiere instalación de tavily-cli y autenticación mediante clave API a través de tvly login.
official
tavily-crawl
tavily-ai
Rastreador de sitios web multipágina con filtrado semántico y exportación a Markdown. Rastrea secciones completas del sitio con control de profundidad y amplitud; filtra por expresión regular de ruta, dominio o instrucciones en lenguaje natural para enfocar los resultados. Guarda cada página como archivos Markdown locales mediante --output-dir, o devuelve JSON estructurado para procesamiento agéntico. Usa instrucciones semánticas con extracción por fragmentos para evitar la saturación de contexto al alimentar resultados a LLMs; usa extracción de página completa para descargas de documentación sin conexión. Compatible con...
official
tavily-dynamic-search
tavily-ai
Busca en la web, filtra resultados y extrae contenido para que los datos de búsqueda sin procesar nunca entren en tu ventana de contexto. Solo tu salida curada de print() regresa.
official