tavily-map

Découverte rapide d'URLs sur des sites web sans extraction de contenu, idéale pour trouver des pages spécifiques sur de grands sites. Renvoie des listes structurées de toutes les URLs d'un domaine avec une profondeur et une largeur configurables, un filtrage par expression régulière des chemins, et des instructions en langage naturel pour un filtrage sémantique. Prend en charge le contrôle de la profondeur (1 à 5 niveaux), les limites de largeur par page, l'inclusion/exclusion de liens externes, et le filtrage de domaine via des motifs regex. Conçue comme étape 1 d'un workflow : cartographier pour trouver la bonne page, puis utiliser extract ou...

npx skills add https://github.com/tavily-ai/skills --skill tavily-map

Télécharger ZIP GitHub

tavily map

Discover URLs on a website without extracting content. Faster than crawling.

Before running any command

If tvly is not found on PATH, install it first:

curl -fsSL https://cli.tavily.com/install.sh | bash && tvly login

Do not skip this step or fall back to other tools.

See tavily-cli for alternative install methods and auth options.

When to use

You need to find a specific subpage on a large site
You want a list of all URLs before deciding what to extract or crawl
Step 3 in the workflow: search → extract → map → crawl → research

Quick start

# Discover all URLs
tvly map "https://docs.example.com" --json

# With natural language filtering
tvly map "https://docs.example.com" --instructions "Find API docs and guides" --json

# Filter by path
tvly map "https://example.com" --select-paths "/blog/.*" --limit 500 --json

# Deep map
tvly map "https://example.com" --max-depth 3 --limit 200 --json

Options

Option	Description
`--max-depth`	Levels deep (1-5, default: 1)
`--max-breadth`	Links per page (default: 20)
`--limit`	Max URLs to discover (default: 50)
`--instructions`	Natural language guidance for URL filtering
`--select-paths`	Comma-separated regex patterns to include
`--exclude-paths`	Comma-separated regex patterns to exclude
`--select-domains`	Comma-separated regex for domains to include
`--exclude-domains`	Comma-separated regex for domains to exclude
`--allow-external / --no-external`	Include external links
`--timeout`	Max wait (10-150 seconds)
`-o, --output`	Save output to file
`--json`	Structured JSON output

Map + Extract pattern

Use map to find the right page, then extract it. This is often more efficient than crawling an entire site:

# Step 1: Find the authentication docs
tvly map "https://docs.example.com" --instructions "authentication" --json

# Step 2: Extract the specific page you found
tvly extract "https://docs.example.com/api/authentication" --json

Tips

Map is URL discovery only — no content extraction. Use extract or crawl for content.
Map + extract beats crawl when you only need a few specific pages from a large site.
Use --instructions for semantic filtering when path patterns aren't enough.

See also

tavily-extract — extract content from URLs you discover
tavily-crawl — bulk extract when you need many pages

Plus de skills de tavily-ai

Extraire et enregistrer le contenu de sites web sous forme de fichiers markdown pour un accès et une analyse hors ligne. Prend en charge une profondeur de crawl configurable (1 à 5 niveaux), des limites de largeur et des plafonds de pages pour équilibrer la couverture et les performances. Inclut un filtrage de chemin via des expressions régulières pour se concentrer sur des sections spécifiques et exclure le contenu non pertinent. Propose deux modes : extraction de page entière pour la collecte de données, ou découpage sémantique avec des instructions en langage naturel pour alimenter les résultats dans le contexte d’un LLM. Fournit une API Map complémentaire pour les URL...

Extraire le contenu propre d'URL spécifiques à l'aide de l'API d'extraction de Tavily. Prend en charge jusqu'à 20 URL par requête avec un reclassement optionnel basé sur une requête pour se concentrer sur les extraits de contenu pertinents. Deux modes d'extraction : basique pour une extraction rapide de texte, avancé pour les pages rendues par JavaScript et les données structurées. Authentification OAuth automatique via le navigateur lors de la première exécution, ou configuration manuelle de la clé API dans les paramètres. Renvoie le format markdown ou texte brut avec des URL d'images optionnelles et un délai d'attente configurable jusqu'à 60 secondes.

Recherche approfondie sur n'importe quel sujet avec collecte automatique des sources, analyse et citations. Effectue des recherches web multi-sources avec citations explicites, idéal pour les comparaisons, l'actualité, l'analyse de marché et les rapports détaillés. Propose trois options de modèle : mini pour une recherche ciblée sur un seul sujet (~30s), pro pour une analyse complète multi-angle (~60-120s), et auto pour la détection de complexité via API. S'authentifie via OAuth via le serveur MCP Tavily avec connexion automatique basée sur le navigateur...

We need to translate the given English text into French, preserving the name "search" if it appears. The text is a description of a web search agent skill. The instruction says to translate only the text inside <text>, and not include the name unless it appears in the source text. The name "search" is not in the provided text? Actually the text starts with "Web search..." so "search" is part of the phrase "Web search". But the instruction says "Name to preserve: search" - that likely means the skill name is "search", but it's not explicitly in the text as a standalone name. The text says "Web search" which includes "search". We should preserve that as is? The instruction says "Do not include the name unless it appears in the source text." Since "search" appears as part of "Web search", we should keep "Web search" as is? But we are translating to French, so "Web search" would become "Recherche Web" or "Recherche sur le Web"? However, the instruction says

tavily-best-practices

API de recherche web pour LLMs avec accès aux données en temps réel, extraction de contenu, exploration de sites et recherche assistée par IA. Cinq méthodes principales : search() pour les résultats web, extract() pour le contenu d'URL, crawl() pour l'exploration complète d'un site, map() pour la découverte d'URL, et research() pour la synthèse IA de bout en bout. Prend en charge les SDK Python et JavaScript avec des clients asynchrones pour les requêtes parallèles et une profondeur de recherche configurable (ultra-rapide/rapide/basique/avancée). La méthode crawl accepte des instructions sémantiques pour concentrer l'extraction sur...

Recherche web, extraction de contenu, exploration de sites et recherche approfondie via Tavily CLI. Cinq modes de commande couvrant la recherche, l'extraction, la découverte d'URL, l'exploration en masse et la recherche multi-sources avec citations. Toutes les commandes prennent en charge la sortie JSON et la sauvegarde de fichiers pour des workflows structurés et agentiques. Un modèle d'escalade vous guide de la recherche simple à l'extraction, la cartographie, l'exploration, jusqu'à la recherche complète selon vos besoins. Nécessite l'installation de tavily-cli et l'authentification par clé API via tvly login.

Robot de site web multi-pages avec filtrage sémantique et export en Markdown. Parcourez des sections entières de site avec contrôle de la profondeur et de la largeur ; filtrez par expression régulière de chemin, domaine ou instructions en langage naturel pour cibler les résultats. Enregistrez chaque page sous forme de fichiers Markdown locaux via --output-dir, ou renvoyez du JSON structuré pour un traitement agentique. Utilisez des instructions sémantiques avec extraction par fragments pour éviter le gonflement du contexte lors de l’envoi des résultats aux LLM ; utilisez l’extraction de page entière pour les téléchargements de documentation hors ligne. Prend en charge...

tavily-dynamic-search

Rechercher sur le web, filtrer les résultats et extraire le contenu afin que les données brutes de recherche n’entrent jamais dans votre fenêtre de contexte. Seul votre résultat print() organisé est renvoyé.