Decodo MCP Server

offiziell

Einfacher Zugriff auf Webdaten. Vereinfachter Abruf von Informationen aus Websites und Online-Quellen.

Dokumentation

Decodo MCP Server

Install MCP Server

Verbinden Sie LLMs und KI-Agenten mit Live-Webdaten über MCP (Model Context Protocol). Der Decodo MCP Server ermöglicht das Scraping von Websites, Suchmaschinen, E-Commerce-Plattformen und sozialen Medien direkt aus KI-Tools wie Claude, Cursor und Windsurf – ganz ohne eigene Scraping-Infrastruktur von Grund auf neu aufbauen zu müssen.

  • Strukturierte Ausgaben in JSON, Markdown und Screenshots
  • Serverseitiges JavaScript-Rendering und Anti-Bot-Handling
  • Über 125 Mio. IPs in mehr als 195 Standorten

Was ist der Decodo MCP Server?

Der Decodo MCP Server ist eine Web-Scraping-Schicht für KI-Agenten. Er verbindet MCP-kompatible Clients mit der Web Scraping API von Decodo und ermöglicht:

  • Web Scraping für LLMs
  • Echtzeit-Datenabruf für RAG
  • Browsen und Recherchieren durch KI-Agenten
  • Strukturierte Datenextraktion von dynamischen Websites

Statt Proxys, Parser und Wiederholungslogik zu verwalten, erhalten Sie einen einzigen Integrationspunkt für zuverlässigen Zugriff auf Webdaten.

Warum MCP für Web Scraping nutzen?

Das Model Context Protocol (MCP) ist der aufstrebende Standard für die Anbindung von KI-Agenten an externe Tools und Datenquellen. Mit MCP:

  • Können Agenten dynamisch Tools aufrufen
  • Bleiben Integrationen standardisiert
  • Skalieren Workflows über Umgebungen hinweg

Der Decodo MCP Server bietet Ihren Agenten über diesen Standard zuverlässigen, produktionsreifen Webzugriff.

Hauptfunktionen

Web Scraping für KI-Agenten, keine Infrastruktur erforderlich. Scrapen Sie jede Website, einschließlich JavaScript-lastiger Seiten, ohne sich um Proxy-Rotation, CAPTCHA-Lösung oder Anti-Bot-Systeme kümmern zu müssen.

Strukturierte Ausgaben für LLM-Workflows. Markdown (LLM-bereit), JSON (für strukturierte Pipelines) und Screenshots (für visuellen Kontext), konzipiert für RAG-Pipelines, KI-Recherche-Agenten und Automatisierungsabläufe.

Integrierte Unterstützung für beliebte Ziele. Vorgefertigte Tools für Google und Bing (SERPs), Amazon, Walmart und Target (E-Commerce), Reddit, TikTok und YouTube (soziale Medien) sowie ChatGPT und Perplexity (KI-Suche).

Globale Proxy-Infrastruktur. Über 125 Mio. Residential-IPs, mehr als 195 Geo-Standorte und eine Erfolgsquote von 99,99 % selbst bei den am stärksten geschützten Zielen.

Modulare MCP-Toolsets. Aktivieren Sie nur, was Sie benötigen: web, search, ecommerce, social_media, ai für eine übersichtlichere Tool-Auswahl und bessere Agentenleistung.

Schnelle Time-to-Value. Vom API-Schlüssel zum ersten Scrape in Minuten, ohne Einrichtungsaufwand.

Anwendungsfälle

Nutzen Sie den Decodo MCP Server, wenn Sie Web Scraping für KI-Agenten, strukturierte Datenextraktion in großem Maßstab, zuverlässigen Zugriff auf dynamische Websites, Echtzeitdaten für RAG oder eine Alternative zum Aufbau einer eigenen Scraping-Infrastruktur benötigen. Typische Szenarien:

  • KI-gestütztes Web Scraping – Geben Sie LLMs die Möglichkeit, aktuelle Daten zu sammeln, anstatt sich auf statische Trainingsdaten zu verlassen.
  • RAG mit Live-Daten – Integrieren Sie Echtzeit-Ergebnisse von Google, Bing und KI-Suchanfragen in Retrieval- Pipelines.
  • E-Commerce-Intelligence – Verfolgen Sie Produktpreise, Angebote und Verkäufer über Marktplätze hinweg, ohne blockiert zu werden.
  • Social-Media-Datenerfassung – Sammeln Sie Beiträge, Kanäle und Engagement-Daten von Reddit, TikTok und YouTube.
  • Reise- und Preisaggregation – Erstellen Sie Tools, die Live-Preise und Verfügbarkeiten über Websites hinweg sammeln.

Schnellstart

  1. Erstellen Sie ein kostenloses Konto unter dashboard.decodo.com – bis zu 2.000 kostenlose Anfragen, keine Kreditkarte erforderlich.
  2. Holen Sie sich Ihren API-Schlüssel. Beziehen Sie ein Basic-Authentication-Token für die Web Scraping API aus dem Dashboard.
  3. Laden Sie Node.js 18+ herunter von https://nodejs.org.
  4. Besorgen Sie sich einen MCP-Client wie Claude Desktop, Cursor, Windsurf oder andere MCP-kompatible Tools.
  5. Konfigurieren Sie den MCP-Server in Ihrem KI-Client (siehe Konfigurationsbeispiele unten).

Verbindung zum Decodo MCP Server

Öffnen Sie Ihren bevorzugten MCP-Client und fügen Sie die folgende Konfiguration hinzu (siehe Beispiele für Claude Code, Cursor, Windsurf unten):

{
  "mcpServers": {
    "Decodo": {
      "url": "https://mcp.decodo.com/mcp",
      "headers": {
        "Authorization": "Basic <basic_auth_token>"
      }
    }
  }
}

Claude Desktop

  1. Öffnen Sie Claude Desktop → Einstellungen → Entwickler → Konfiguration bearbeiten.
  2. Fügen Sie in claude_desktop_config.json hinzu:
{
  "mcpServers": {
    "Decodo": {
      "command": "npx",
      "args": ["-y", "@decodo/mcp-server"],
      "env": {
        "SCRAPER_API_TOKEN": "<basic_auth_token>",
        "TOOLSETS": "web,ai"
      }
    }
  }
}
  1. Speichern und Claude Desktop neu starten.

Cursor

  1. Öffnen Sie Einstellungen → MCP.
  2. Klicken Sie auf „Neuen globalen MCP-Server hinzufügen“ (öffnet mcp.json).
  3. Fügen Sie dieselbe Konfiguration wie oben hinzu.
  4. Speichern – achten Sie auf eine grüne Statusanzeige neben Decodo.

Windsurf

  1. Öffnen Sie Einstellungen → Windsurf-Einstellungen.
  2. Scrollen Sie zu Cascade → „Benutzerdefinierten Server hinzufügen“ + (öffnet mcp_config.json).
  3. Fügen Sie dieselbe Konfiguration wie oben hinzu.
  4. Speichern und Windsurf neu starten.

Testen Sie Ihr Setup

Sobald die Verbindung hergestellt ist, versuchen Sie diesen Prompt in Ihrem Client:

▎ "Scrape die Titel der Top-5-Artikel von Hacker News"

Sie sollten innerhalb von Sekunden eine strukturierte Liste zurückerhalten. Wenn Sie einen Authentifizierungsfehler sehen, überprüfen Sie Ihr Token im Dashboard.

Optional: Aktivieren bestimmter Toolsets

Lokales Ausführen des MCP-Servers

Voraussetzungen

Schritt-für-Schritt-Anleitung

  1. Klonen Sie dieses Repository:
git clone https://github.com/Decodo/mcp-server
  1. Führen Sie die folgenden Befehle im Terminal aus:
cd decodo-mcp-server
npm install
npm run build
  1. Notieren Sie sich Ihren Build-Speicherort:
cd build/
pwd

Wenn Sie index.js an das Ende dieses Verzeichnisses anhängen, sollte Ihr Build-Dateipfad etwa so aussehen:

/Users/your.user/projects/decodo-mcp/build/index.js
  1. Aktualisieren Sie Ihren MCP-Client mit den Serverinformationen:
{
  "mcpServers": {
    "decodo-mcp": {
      "command": "node",
      "args": ["/Users/your.user/projects/decodo-mcp/build/index.js"],
      "env": {
        "SCRAPER_API_TOKEN": "<web_scraping_api_base64_token>"
      }
    }
  }
}

Toolsets

Tools sind in Toolsets organisiert. Sie können bestimmte Toolsets gezielt aktivieren, indem Sie eine durch Kommas getrennte Liste über den Abfrageparameter toolsets übergeben:

    "Decodo MCP Server": {
      "url": "https://mcp.decodo.com/mcp?toolsets=web,ai",
      "headers": {
        "Authorization": "Basic <your_auth_token>"
      }
    }

Wenn keine Toolsets angegeben sind, werden alle Tools registriert.

ToolsetTools
webscrape_as_markdown, screenshot
searchgoogle_search, google_ads, google_lens, google_travel_hotels, bing_search
ecommerceamazon_search, amazon_product, amazon_pricing, amazon_sellers, amazon_bestsellers, walmart_search, walmart_product, target_search, target_product, tiktok_shop_search, tiktok_shop_product, tiktok_shop_url
social_mediareddit_post, reddit_subreddit, reddit_user, tiktok_post, youtube_metadata, youtube_channel, youtube_subtitles, youtube_search
aichatgpt, perplexity, google_ai_mode

Tools

Der Server stellt die folgenden Tools bereit:

ToolBeschreibungBeispiel-Prompt
scrape_as_markdownScraped eine beliebige Ziel-URL, erwartet eine URL im Prompt. Gibt Ergebnisse in Markdown zurück.Scrape peacock.com von einer US-IP-Adresse und nenne mir die Preise.
screenshotErstellt einen Screenshot einer beliebigen Webseite und gibt ihn als PNG-Bild zurück.Mache einen Screenshot von github.com von einer US-IP-Adresse.
google_searchDurchsucht Google Search nach einer bestimmten Anfrage und gibt geparste Ergebnisse zurück.Durchsuche Google Search nach Schuhen und nenne mir die Top-Position.
google_adsScraped Google Ads-Suchergebnisse.Scrape Google Ads für Laptop und zeige mir die Top-Anzeigen.
google_lensScraped Google Lens-Bildersuchergebnisse.Suche mit Google Lens nach diesem Bild: https://example.com/image.jpg
google_ai_modeScraped Google AI Mode (Search with AI)-Ergebnisse.Frage Google AI Mode: Was sind die drei beliebtesten Hunderassen?
google_travel_hotelsScraped Google Travel Hotels-Suchergebnisse.Suche mit Google Travel Hotels nach Hotels in Paris.
amazon_searchDurchsucht Amazon Search nach einer bestimmten Anfrage und gibt geparste Ergebnisse zurück.Durchsuche Amazon Search nach kabelloser Tastatur.
amazon_productScraped eine Amazon-Produktseite.Scrape das Amazon-Produkt B09H74FXNW und zeige mir die Details.
amazon_pricingScraped Amazon-Produktpreisinformationen.Rufe die Preisinformationen für das Amazon-Produkt B09H74FXNW ab.
amazon_sellersScraped Amazon-Verkäuferinformationen.Rufe Informationen über den Amazon-Verkäufer A1R0Z7FJGTKESH ab.
amazon_bestsellersScraped die Amazon-Bestsellerliste.Zeige mir die Amazon-Bestseller im Bereich Elektronik.
walmart_searchDurchsucht Walmart Search nach einer bestimmten Anfrage und gibt geparste Ergebnisse zurück.Durchsuche Walmart Search nach Campingzelt.
walmart_productScraped eine Walmart-Produktseite.Scrape das Walmart-Produkt 15296401808.
target_searchDurchsucht Target Search nach einer bestimmten Anfrage und gibt geparste Ergebnisse zurück.Durchsuche Target Search nach Küchengeräten.
target_productScraped eine Target-Produktseite.Scrape das Target-Produkt 92186007.
tiktok_postScraped eine TikTok-Post-URL für strukturierte Daten (z. B. Engagement, Beschreibung, Hashtags).Scrape diesen TikTok-Post: https://www.tiktok.com/@nba/video/7393013274725403950
tiktok_shop_searchDurchsucht TikTok Shop Search nach einer bestimmten Anfrage und gibt geparste Ergebnisse zurück.Durchsuche TikTok Shop Search nach Handyhüllen.
tiktok_shop_productScraped eine TikTok Shop-Produktseite.Scrape das TikTok Shop-Produkt 1731541214379741272.
tiktok_shop_urlScraped eine TikTok Shop-Seite anhand der URL.Scrape diese TikTok Shop-URL: https://www.tiktok.com/shop/s?q=HEADPHONES
youtube_metadataScraped YouTube-Videometadaten.Rufe Metadaten für das YouTube-Video dFu9aKJoqGg ab.
youtube_channelScraped YouTube-Kanalvideos.Scrape den YouTube-Kanal @decodo_official.
youtube_subtitlesScraped YouTube-Videountertitel.Rufe Untertitel für das YouTube-Video L8zSWbQN-v8 ab.
youtube_searchDurchsucht YouTube-Videos.Suche auf YouTube nach "How to care for chinchillas".
reddit_postScraped einen bestimmten Reddit-Beitrag.Scrape den folgenden Reddit-Beitrag: https://www.reddit.com/r/horseracing/comments/1nsrn3/
reddit_subredditScraped Reddit-Subreddit-Ergebnisse.Scrape die Top-5-Beiträge auf r/Python diese Woche.
reddit_userScraped ein Reddit-Benutzerprofil und dessen Beiträge/Kommentare.Scrape diesen Reddit-Benutzer: https://www.reddit.com/user/IWasRightOnce/
bing_searchScraped Bing Search-Ergebnisse.Suche mit Bing nach Laptop-Reviews.
chatgptSuche und interagiere mit ChatGPT für KI-gestützte Antworten und Konversationen.Bitte ChatGPT, Quantencomputing in einfachen Worten zu erklären.
perplexitySuche und interagiere mit Perplexity für KI-gestützte Antworten und Konversationen.Frage Perplexity nach den neuesten Trends in der Webentwicklung.

Parameter

Die folgenden Parameter werden aus Benutzer-Prompts abgeleitet:

ParameterBeschreibung
jsRenderRendert die Ziel-URL in einem Headless-Browser.
geoLegt das Land fest, aus dem die Anfrage stammen soll.
localeLegt das Gebietsschema der Anfrage fest.
tokenLimitKürzt den Antwortinhalt bis zu diesem Limit. Nützlich, wenn das Kontextfenster klein ist.
promptPrompt, der an KI-Tools gesendet werden soll (chatgpt, perplexity).
searchAktiviert die Websuchfunktion von ChatGPT (nur chatgpt).
xhrWenn true, werden XHR- oder Fetch-Antworten in das Scrape-Ergebnis einbezogen, sofern unterstützt (z. B. tiktok_post).
deviceTypeGerätetyp, der für die Anfrage emuliert werden soll (desktop, mobile, tablet).
domainFür die Anfrage zu verwendende Domain (z. B. amazon.com, amazon.co.uk, bing.com).
pageFromStartseitennummer für die Paginierung.
deliveryZipPostleitzahl für den Lieferort (Target, Walmart).
storeIdStore-ID für den lokalen Bestand (Target, Walmart).
countryLand für TikTok Shop-Anfragen.
limitMaximale Anzahl der zurückzugebenden Ergebnisse (z. B. YouTube-Kanalvideos).
language_codeSprachcode für Untertitel (z. B. en, es).

Beispiele

Scraping von geografisch eingeschränkten Inhalten

Fragen Sie Ihren KI-Agenten mit folgendem Prompt:

Scrape peacock.com from a German IP address and tell me the pricing.

Dieser Prompt wird anzeigen, dass peacock.com geografisch eingeschränkt ist. Um die Geobeschränkung zu umgehen:

Scrape peacock.com from a US IP address and tell me the pricing.

Begrenzung der Anzahl der Antwort-Tokens

Wenn Ihr Agent ein kleines Kontextfenster hat, wird der vom Scraping zurückgegebene Inhalt automatisch gekürzt, um einen Kontextüberlauf zu vermeiden. Sie können die Anzahl der zurückgegebenen Tokens in Ihrem Prompt erhöhen:

Scrape hacker news, return 50k tokens.

Wenn Ihr Agent ein großes Kontextfenster hat, weisen Sie ihn an, full content zurückzugeben:

Scrape hacker news, return full content.

Verwandte Repositories

Web Scraping API, Decodo OpenClaw skill

Ausprobieren

Integrieren Sie den Decodo MCP Server mit nur wenigen Klicks in Ihren KI-Workflow und statten Sie Ihre KI-Agenten mit Echtzeitdaten von jeder Website aus.

Kostenlos starten | Dokumentation | Discord

Lizenz

Der gesamte Code wird unter der MIT-Lizenz veröffentlicht.