Decodo

officiel

Accès facile aux données web. Récupération simplifiée d'informations depuis des sites web et sources en ligne.

GitHub

Que pouvez-vous faire avec Decodo MCP ?

Extraire n'importe quelle page web en Markdown — extraire un contenu propre et prêt pour LLM depuis une URL en utilisant scrape_as_markdown.
Capturer des captures d'écran de pages web — prendre un instantané visuel de n'importe quel site avec screenshot.
Rechercher sur Google et Bing — récupérer les résultats SERP analysés via google_search et bing_search.
Extraire des données de produits eCommerce — consulter les prix, les vendeurs et les meilleures ventes sur Amazon, Walmart ou Target.
Recueillir du contenu de médias sociaux — extraire des publications Reddit, des vidéos TikTok, ou des métadonnées et sous-titres YouTube.
Interroger les outils de recherche IA — interagir avec ChatGPT, Perplexity ou Google AI Mode pour des réponses alimentées par l'IA.

Documentation

Serveur MCP Decodo

Connectez les LLM et les agents IA aux données web en direct grâce à MCP (Model Context Protocol). Le serveur MCP Decodo vous permet de scraper des sites web, des moteurs de recherche, des plateformes e-commerce et des réseaux sociaux directement depuis des outils IA comme Claude, Cursor et Windsurf, sans avoir à construire une infrastructure de scraping à partir de zéro.

Sorties structurées en JSON, Markdown et captures d'écran
Rendu JavaScript côté serveur et gestion anti-bot
Plus de 125 millions d'IP dans plus de 195 emplacements

Qu'est-ce que le serveur MCP Decodo ?

Le serveur MCP Decodo est une couche de scraping web pour les agents IA. Il connecte les clients compatibles MCP à l'API de scraping web de Decodo, permettant :

Le scraping web pour les LLM
La récupération de données en temps réel pour le RAG
La navigation et la recherche par des agents IA
L'extraction de données structurées à partir de sites web dynamiques

Au lieu de maintenir des proxies, des parseurs et une logique de nouvelle tentative, vous obtenez un point d'intégration unique pour un accès fiable aux données web.

Pourquoi utiliser MCP pour le scraping web ?

Model Context Protocol (MCP) est le standard émergent pour connecter les agents IA à des outils et sources de données externes. Avec MCP :

Les agents peuvent appeler des outils dynamiquement
Les intégrations restent standardisées
Les flux de travail s'adaptent à tous les environnements

Le serveur MCP Decodo offre à vos agents un accès web fiable et prêt pour la production via ce standard.

Fonctionnalités clés

Scraping web pour les agents IA, sans infrastructure requise. Scrapez n'importe quel site web, y compris les pages lourdes en JavaScript, sans gérer la rotation de proxy, la résolution de CAPTCHA ou les systèmes anti-bot.

Sorties structurées pour les flux de travail LLM. Markdown (prêt pour les LLM), JSON (pour les pipelines structurés) et captures d'écran (pour le contexte visuel), conçus pour les pipelines RAG, les agents de recherche IA et les flux d'automatisation.

Support intégré pour les cibles populaires. Outils prêts à l'emploi pour Google et Bing (SERP), Amazon, Walmart et Target (eCommerce), Reddit, TikTok et YouTube (réseaux sociaux), et ChatGPT et Perplexity (recherche IA).

Infrastructure proxy mondiale. Plus de 125 millions d'IP résidentielles, plus de 195 emplacements géographiques et un taux de réussite de 99,99 % même sur les cibles les plus protégées.

Kits d'outils MCP modulaires. Activez uniquement ce dont vous avez besoin : web, search, ecommerce, social_media, ai pour une sélection d'outils plus propre et de meilleures performances de l'agent.

Mise en œuvre rapide. De la clé API au premier scrape en quelques minutes, sans frais de configuration.

Cas d'utilisation

Utilisez le serveur MCP Decodo lorsque vous avez besoin de scraping web pour les agents IA, d'extraction de données structurées à grande échelle, d'un accès fiable aux sites web dynamiques, de données en temps réel pour le RAG, ou d'une alternative à la construction d'une infrastructure de scraping à partir de zéro. Scénarios courants :

Scraping web alimenté par l'IA – donnez aux LLM la capacité de collecter des données fraîches au lieu de s'appuyer sur des données d'entraînement statiques.
RAG avec données en direct – intégrez les résultats de recherche en temps réel de Google, Bing et de l'IA dans les pipelines de récupération.
Intelligence eCommerce – suivez les prix des produits, les annonces et les vendeurs sur les places de marché sans être bloqué.
Collecte de données sur les réseaux sociaux – rassemblez des publications, des chaînes et des données d'engagement de Reddit, TikTok et YouTube.
Agrégation de voyages et de prix – construisez des outils qui collectent les prix et la disponibilité en direct sur les sites web.

Démarrage rapide

Créez un compte gratuit sur dashboard.decodo.com – jusqu'à 2 000 requêtes gratuites, aucune carte de crédit requise.
Obtenez votre clé API. Obtenez un jeton d'authentification de base pour l'API de scraping web depuis le tableau de bord.
Téléchargez Node.js 18+ depuis https://nodejs.org.
Obtenez un client MCP comme Claude Desktop, Cursor, Windsurf ou d'autres outils compatibles MCP.
Configurez le serveur MCP dans votre client IA (voir les exemples de configuration ci-dessous).

Connexion au serveur MCP de Decodo

Ouvrez votre client MCP préféré et ajoutez la configuration suivante (voir les exemples pour Claude Code, Cursor, Windsurf ci-dessous) :

{
  "mcpServers": {
    "Decodo": {
      "url": "https://mcp.decodo.com/mcp",
      "headers": {
        "Authorization": "Basic <basic_auth_token>"
      }
    }
  }
}

Claude Desktop

Ouvrez Claude Desktop → Paramètres → Développeur → Modifier la configuration.
Ajoutez à claude_desktop_config.json :

{
  "mcpServers": {
    "Decodo": {
      "command": "npx",
      "args": ["-y", "@decodo/mcp-server"],
      "env": {
        "SCRAPER_API_TOKEN": "<basic_auth_token>",
        "TOOLSETS": "web,ai"
      }
    }
  }
}

Enregistrez et redémarrez Claude Desktop.

Cursor

Ouvrez Paramètres → MCP.
Cliquez sur Ajouter un nouveau serveur MCP global (ouvre mcp.json).
Ajoutez la même configuration que ci-dessus.
Enregistrez — recherchez un indicateur d'état vert à côté de Decodo.

Windsurf

Ouvrez Paramètres → Paramètres Windsurf.
Faites défiler jusqu'à Cascade → Ajouter un serveur personnalisé + (ouvre mcp_config.json).
Ajoutez la même configuration que ci-dessus.
Enregistrez et redémarrez Windsurf.

Testez votre configuration

Une fois connecté, essayez cette invite dans votre client :

▎ "Scrape les titres des 5 premiers articles de Hacker News"

Vous devriez recevoir une liste structurée en quelques secondes. Si vous voyez une erreur d'authentification, vérifiez votre jeton depuis le tableau de bord.

Optionnel : activer des kits d'outils spécifiques

Exécuter le serveur MCP localement

Prérequis

Node.js 18.0+
Un client MCP - les choix populaires sont Claude Desktop et Cursor

Guide étape par étape

Clonez ce dépôt :

git clone https://github.com/Decodo/mcp-server

Exécutez les commandes suivantes dans le terminal :

cd decodo-mcp-server
npm install
npm run build

Notez l'emplacement de votre build :

cd build/
pwd

En ajoutant index.js à la fin de ce répertoire, l'emplacement de votre fichier de build devrait ressembler à ceci :

/Users/your.user/projects/decodo-mcp/build/index.js

Mettez à jour votre client MCP avec les informations du serveur :

{
  "mcpServers": {
    "decodo-mcp": {
      "command": "node",
      "args": ["/Users/your.user/projects/decodo-mcp/build/index.js"],
      "env": {
        "SCRAPER_API_TOKEN": "<web_scraping_api_base64_token>"
      }
    }
  }
}

Kits d'outils

Les outils sont organisés en kits d'outils. Vous pouvez activer sélectivement des kits d'outils spécifiques en passant une liste séparée par des virgules via le paramètre de requête toolsets :

    "Decodo MCP Server": {
      "url": "https://mcp.decodo.com/mcp?toolsets=web,ai",
      "headers": {
        "Authorization": "Basic <your_auth_token>"
      }
    }

Lorsqu'aucun kit d'outils n'est spécifié, tous les outils sont enregistrés.

Kit d'outils	Outils
`web`	`scrape_as_markdown`, `screenshot`
`search`	`google_search`, `google_ads`, `google_lens`, `google_travel_hotels`, `bing_search`
`ecommerce`	`amazon_search`, `amazon_product`, `amazon_pricing`, `amazon_sellers`, `amazon_bestsellers`, `walmart_search`, `walmart_product`, `target_search`, `target_product`, `tiktok_shop_search`, `tiktok_shop_product`, `tiktok_shop_url`
`social_media`	`reddit_post`, `reddit_subreddit`, `reddit_user`, `tiktok_post`, `youtube_metadata`, `youtube_channel`, `youtube_subtitles`, `youtube_search`
`ai`	`chatgpt`, `perplexity`, `google_ai_mode`

Outils

Le serveur expose les outils suivants :

Outil	Description	Exemple de prompt
`scrape_as_markdown`	Scrape n'importe quelle URL cible, attend une URL donnée via le prompt. Renvoie les résultats en Markdown.	Scrape peacock.com depuis une adresse IP américaine et indique-moi les tarifs.
`screenshot`	Capture une capture d'écran de n'importe quelle page web et la renvoie sous forme d'image PNG.	Prends une capture d'écran de github.com depuis une adresse IP américaine.
`google_search`	Scrape Google Search pour une requête donnée et renvoie les résultats analysés.	Scrape Google Search pour chaussures et indique-moi la première position.
`google_ads`	Scrape les résultats de recherche Google Ads.	Scrape Google Ads pour ordinateur portable et montre-moi les meilleures annonces.
`google_lens`	Scrape les résultats de recherche d'images Google Lens.	Recherche sur Google Lens pour cette image : https://example.com/image.jpg
`google_ai_mode`	Scrape les résultats du mode Google AI (Recherche avec IA).	Demande au mode Google AI : Quelles sont les trois meilleures races de chiens ?
`google_travel_hotels`	Scrape les résultats de recherche Google Travel Hotels.	Recherche sur Google Travel Hotels des hôtels à Paris.
`amazon_search`	Scrape Amazon Search pour une requête donnée et renvoie les résultats analysés.	Scrape Amazon Search pour clavier sans fil.
`amazon_product`	Scrape la page produit Amazon.	Scrape le produit Amazon B09H74FXNW et montre-moi les détails.
`amazon_pricing`	Scrape les informations de prix d'un produit Amazon.	Obtiens le prix du produit Amazon B09H74FXNW.
`amazon_sellers`	Scrape les informations du vendeur Amazon.	Obtiens des informations sur le vendeur Amazon A1R0Z7FJGTKESH.
`amazon_bestsellers`	Scrape la liste des meilleures ventes Amazon.	Montre-moi les meilleures ventes Amazon en électronique.
`walmart_search`	Scrape Walmart Search pour une requête donnée et renvoie les résultats analysés.	Scrape Walmart Search pour tente de camping.
`walmart_product`	Scrape la page produit Walmart.	Scrape le produit Walmart 15296401808.
`target_search`	Scrape Target Search pour une requête donnée et renvoie les résultats analysés.	Scrape Target Search pour appareils de cuisine.
`target_product`	Scrape la page produit Target.	Scrape le produit Target 92186007.
`tiktok_post`	Scrape l'URL d'un post TikTok pour des données structurées (ex. engagement, légende, hashtags).	Scrape ce post TikTok : https://www.tiktok.com/@nba/video/7393013274725403950
`tiktok_shop_search`	Scrape TikTok Shop Search pour une requête donnée et renvoie les résultats analysés.	Scrape TikTok Shop Search pour coques de téléphone.
`tiktok_shop_product`	Scrape la page produit TikTok Shop.	Scrape le produit TikTok Shop 1731541214379741272.
`tiktok_shop_url`	Scrape la page TikTok Shop par URL.	Scrape cette URL TikTok Shop : https://www.tiktok.com/shop/s?q=HEADPHONES
`youtube_metadata`	Scrape les métadonnées d'une vidéo YouTube.	Obtiens les métadonnées de la vidéo YouTube dFu9aKJoqGg.
`youtube_channel`	Scrape les vidéos d'une chaîne YouTube.	Scrape la chaîne YouTube @decodo_official.
`youtube_subtitles`	Scrape les sous-titres d'une vidéo YouTube.	Obtiens les sous-titres de la vidéo YouTube L8zSWbQN-v8.
`youtube_search`	Recherche des vidéos YouTube.	Recherche sur YouTube "Comment prendre soin des chinchillas".
`reddit_post`	Scrape un post Reddit spécifique.	Scrape le post Reddit suivant : https://www.reddit.com/r/horseracing/comments/1nsrn3/
`reddit_subreddit`	Scrape les résultats d'un subreddit.	Scrape les 5 meilleurs posts de r/Python cette semaine.
`reddit_user`	Scrape le profil d'un utilisateur Reddit et ses posts/commentaires.	Scrape cet utilisateur Reddit : https://www.reddit.com/user/IWasRightOnce/
`bing_search`	Scrape les résultats de recherche Bing.	Recherche sur Bing des avis sur les ordinateurs portables.
`chatgpt`	Recherche et interagis avec ChatGPT pour des réponses et conversations alimentées par l'IA.	Demande à ChatGPT d'expliquer l'informatique quantique en termes simples.
`perplexity`	Recherche et interagis avec Perplexity pour des réponses et conversations alimentées par l'IA.	Demande à Perplexity quelles sont les dernières tendances en développement web.

Paramètres

Les paramètres suivants sont déduits des prompts utilisateur :

Paramètre	Description
`jsRender`	Affiche l'URL cible dans un navigateur headless.
`geo`	Définit le pays d'origine de la requête.
`locale`	Définit les paramètres régionaux de la requête.
`tokenLimit`	Tronque le contenu de la réponse jusqu'à cette limite. Utile si la fenêtre de contexte est petite.
`prompt`	Prompt à envoyer aux outils d'IA (`chatgpt`, `perplexity`).
`search`	Active la fonctionnalité de recherche web de ChatGPT (`chatgpt` uniquement).
`xhr`	Lorsqu'il est vrai, inclut les réponses XHR ou fetch dans le résultat du scrape lorsque cela est pris en charge (ex. `tiktok_post`).
`deviceType`	Type d'appareil à émuler pour la requête (`desktop`, `mobile`, `tablet`).
`domain`	Domaine à utiliser pour la requête (ex., `amazon.com`, `amazon.co.uk`, `bing.com`).
`pageFrom`	Numéro de page de départ pour la pagination.
`deliveryZip`	Code postal pour le lieu de livraison (Target, Walmart).
`storeId`	ID du magasin pour l'inventaire local (Target, Walmart).
`country`	Pays pour les requêtes TikTok Shop.
`limit`	Nombre maximum de résultats à renvoyer (ex., vidéos de chaîne YouTube).
`language_code`	Code de langue pour les sous-titres (ex., `en`, `es`).

Exemples

Scraper du contenu géo-restreint

Interrogez votre agent IA avec le prompt suivant :

Scrape peacock.com from a German IP address and tell me the pricing.

Ce prompt indiquera que peacock.com est géo-restreint. Pour contourner la géo-restriction :

Scrape peacock.com from a US IP address and tell me the pricing.

Limiter le nombre de tokens de réponse

Si votre agent a une petite fenêtre de contexte, le contenu renvoyé par le scraping sera automatiquement tronqué, afin d'éviter un débordement de contexte. Vous pouvez augmenter le nombre de tokens renvoyés dans votre prompt :

Scrape hacker news, return 50k tokens.

Si votre agent a une grande fenêtre de contexte, dites-lui de renvoyer full content :

Scrape hacker news, return full content.

Utilisation avec les compétences d'agent Decodo

Ce serveur donne à votre agent les outils de scraping. Decodo/agent-skills lui apprend quand les utiliser, quelle surface utiliser et comment l'appeler — afin que l'agent choisisse le bon outil et les bons paramètres par lui-même au lieu de deviner.

Les compétences acheminent via le CLI decodo, ce serveur MCP hébergé et l'API HTTP brute, et basculent automatiquement vers le serveur MCP lorsqu'aucun shell n'est disponible. Associer les deux donne à votre agent à la fois la couche d'exécution (ce serveur) et la couche de décision (les compétences) en une seule configuration.

Démarrage rapide (Claude Code) :

/plugin marketplace add Decodo/agent-skills
/plugin install decodo@decodo-skills

Consultez le README des compétences d'agent pour l'installation manuelle et d'autres agents (Cursor, Codex, Gemini CLI, Windsurf).

Dépôts associés

API Web Scraping, Compétences d'agent Decodo, Compétence Decodo OpenClaw

Essayez-le

Intégrez le serveur MCP Decodo dans votre flux de travail IA en quelques clics et équipez vos agents IA de données en temps réel provenant de n'importe quel site web.

Commencez gratuitement | Docs | Discord

Licence

Tout le code est publié sous la licence MIT.