crawl

Extraire et enregistrer le contenu de sites web sous forme de fichiers markdown pour un accès et une analyse hors ligne. Prend en charge une profondeur de crawl configurable (1 à 5 niveaux), des limites de largeur et des plafonds de pages pour équilibrer la couverture et les performances. Inclut un filtrage de chemin via des expressions régulières pour se concentrer sur des sections spécifiques et exclure le contenu non pertinent. Propose deux modes : extraction de page entière pour la collecte de données, ou découpage sémantique avec des instructions en langage naturel pour alimenter les résultats dans le contexte d’un LLM. Fournit une API Map complémentaire pour les URL...

npx skills add https://github.com/tavily-ai/skills --skill crawl

Télécharger ZIP GitHub

Plus de skills de tavily-ai

Extraire le contenu propre d'URL spécifiques à l'aide de l'API d'extraction de Tavily. Prend en charge jusqu'à 20 URL par requête avec un reclassement optionnel basé sur une requête pour se concentrer sur les extraits de contenu pertinents. Deux modes d'extraction : basique pour une extraction rapide de texte, avancé pour les pages rendues par JavaScript et les données structurées. Authentification OAuth automatique via le navigateur lors de la première exécution, ou configuration manuelle de la clé API dans les paramètres. Renvoie le format markdown ou texte brut avec des URL d'images optionnelles et un délai d'attente configurable jusqu'à 60 secondes.

Recherche approfondie sur n'importe quel sujet avec collecte automatique des sources, analyse et citations. Effectue des recherches web multi-sources avec citations explicites, idéal pour les comparaisons, l'actualité, l'analyse de marché et les rapports détaillés. Propose trois options de modèle : mini pour une recherche ciblée sur un seul sujet (~30s), pro pour une analyse complète multi-angle (~60-120s), et auto pour la détection de complexité via API. S'authentifie via OAuth via le serveur MCP Tavily avec connexion automatique basée sur le navigateur...

We need to translate the given English text into French, preserving the name "search" if it appears. The text is a description of a web search agent skill. The instruction says to translate only the text inside <text>, and not include the name unless it appears in the source text. The name "search" is not in the provided text? Actually the text starts with "Web search..." so "search" is part of the phrase "Web search". But the instruction says "Name to preserve: search" - that likely means the skill name is "search", but it's not explicitly in the text as a standalone name. The text says "Web search" which includes "search". We should preserve that as is? The instruction says "Do not include the name unless it appears in the source text." Since "search" appears as part of "Web search", we should keep "Web search" as is? But we are translating to French, so "Web search" would become "Recherche Web" or "Recherche sur le Web"? However, the instruction says

tavily-best-practices

API de recherche web pour LLMs avec accès aux données en temps réel, extraction de contenu, exploration de sites et recherche assistée par IA. Cinq méthodes principales : search() pour les résultats web, extract() pour le contenu d'URL, crawl() pour l'exploration complète d'un site, map() pour la découverte d'URL, et research() pour la synthèse IA de bout en bout. Prend en charge les SDK Python et JavaScript avec des clients asynchrones pour les requêtes parallèles et une profondeur de recherche configurable (ultra-rapide/rapide/basique/avancée). La méthode crawl accepte des instructions sémantiques pour concentrer l'extraction sur...

Recherche web, extraction de contenu, exploration de sites et recherche approfondie via Tavily CLI. Cinq modes de commande couvrant la recherche, l'extraction, la découverte d'URL, l'exploration en masse et la recherche multi-sources avec citations. Toutes les commandes prennent en charge la sortie JSON et la sauvegarde de fichiers pour des workflows structurés et agentiques. Un modèle d'escalade vous guide de la recherche simple à l'extraction, la cartographie, l'exploration, jusqu'à la recherche complète selon vos besoins. Nécessite l'installation de tavily-cli et l'authentification par clé API via tvly login.

Robot de site web multi-pages avec filtrage sémantique et export en Markdown. Parcourez des sections entières de site avec contrôle de la profondeur et de la largeur ; filtrez par expression régulière de chemin, domaine ou instructions en langage naturel pour cibler les résultats. Enregistrez chaque page sous forme de fichiers Markdown locaux via --output-dir, ou renvoyez du JSON structuré pour un traitement agentique. Utilisez des instructions sémantiques avec extraction par fragments pour éviter le gonflement du contexte lors de l’envoi des résultats aux LLM ; utilisez l’extraction de page entière pour les téléchargements de documentation hors ligne. Prend en charge...

tavily-dynamic-search

Rechercher sur le web, filtrer les résultats et extraire le contenu afin que les données brutes de recherche n’entrent jamais dans votre fenêtre de contexte. Seul votre résultat print() organisé est renvoyé.

Extrayez du markdown ou du texte propre à partir de jusqu'à 20 URL, avec prise en charge du rendu JavaScript et du découpage ciblé par requête. Gère les pages rendues par JavaScript avec une profondeur d'extraction configurable (basique pour les pages simples, avancée pour les SPA dynamiques et les tableaux). Prend en charge l'extraction ciblée par requête pour ne renvoyer que les fragments de contenu pertinents au lieu des pages entières. Renvoie par déf