Decodo MCP Server
offiziellEinfacher Zugriff auf Webdaten. Vereinfachter Abruf von Informationen aus Websites und Online-Quellen.
Dokumentation
Decodo MCP Server
Verbinden Sie LLMs und KI-Agenten mit Live-Webdaten über MCP (Model Context Protocol). Der Decodo MCP Server ermöglicht das Scraping von Websites, Suchmaschinen, E-Commerce-Plattformen und sozialen Medien direkt aus KI-Tools wie Claude, Cursor und Windsurf – ganz ohne eigene Scraping-Infrastruktur von Grund auf neu aufbauen zu müssen.
- Strukturierte Ausgaben in JSON, Markdown und Screenshots
- Serverseitiges JavaScript-Rendering und Anti-Bot-Handling
- Über 125 Mio. IPs in mehr als 195 Standorten
Was ist der Decodo MCP Server?
Der Decodo MCP Server ist eine Web-Scraping-Schicht für KI-Agenten. Er verbindet MCP-kompatible Clients mit der Web Scraping API von Decodo und ermöglicht:
- Web Scraping für LLMs
- Echtzeit-Datenabruf für RAG
- Browsen und Recherchieren durch KI-Agenten
- Strukturierte Datenextraktion von dynamischen Websites
Statt Proxys, Parser und Wiederholungslogik zu verwalten, erhalten Sie einen einzigen Integrationspunkt für zuverlässigen Zugriff auf Webdaten.
Warum MCP für Web Scraping nutzen?
Das Model Context Protocol (MCP) ist der aufstrebende Standard für die Anbindung von KI-Agenten an externe Tools und Datenquellen. Mit MCP:
- Können Agenten dynamisch Tools aufrufen
- Bleiben Integrationen standardisiert
- Skalieren Workflows über Umgebungen hinweg
Der Decodo MCP Server bietet Ihren Agenten über diesen Standard zuverlässigen, produktionsreifen Webzugriff.
Hauptfunktionen
Web Scraping für KI-Agenten, keine Infrastruktur erforderlich. Scrapen Sie jede Website, einschließlich JavaScript-lastiger Seiten, ohne sich um Proxy-Rotation, CAPTCHA-Lösung oder Anti-Bot-Systeme kümmern zu müssen.
Strukturierte Ausgaben für LLM-Workflows. Markdown (LLM-bereit), JSON (für strukturierte Pipelines) und Screenshots (für visuellen Kontext), konzipiert für RAG-Pipelines, KI-Recherche-Agenten und Automatisierungsabläufe.
Integrierte Unterstützung für beliebte Ziele. Vorgefertigte Tools für Google und Bing (SERPs), Amazon, Walmart und Target (E-Commerce), Reddit, TikTok und YouTube (soziale Medien) sowie ChatGPT und Perplexity (KI-Suche).
Globale Proxy-Infrastruktur. Über 125 Mio. Residential-IPs, mehr als 195 Geo-Standorte und eine Erfolgsquote von 99,99 % selbst bei den am stärksten geschützten Zielen.
Modulare MCP-Toolsets. Aktivieren Sie nur, was Sie benötigen: web, search, ecommerce, social_media,
ai für eine übersichtlichere Tool-Auswahl und bessere Agentenleistung.
Schnelle Time-to-Value. Vom API-Schlüssel zum ersten Scrape in Minuten, ohne Einrichtungsaufwand.
Anwendungsfälle
Nutzen Sie den Decodo MCP Server, wenn Sie Web Scraping für KI-Agenten, strukturierte Datenextraktion in großem Maßstab, zuverlässigen Zugriff auf dynamische Websites, Echtzeitdaten für RAG oder eine Alternative zum Aufbau einer eigenen Scraping-Infrastruktur benötigen. Typische Szenarien:
- KI-gestütztes Web Scraping – Geben Sie LLMs die Möglichkeit, aktuelle Daten zu sammeln, anstatt sich auf statische Trainingsdaten zu verlassen.
- RAG mit Live-Daten – Integrieren Sie Echtzeit-Ergebnisse von Google, Bing und KI-Suchanfragen in Retrieval- Pipelines.
- E-Commerce-Intelligence – Verfolgen Sie Produktpreise, Angebote und Verkäufer über Marktplätze hinweg, ohne blockiert zu werden.
- Social-Media-Datenerfassung – Sammeln Sie Beiträge, Kanäle und Engagement-Daten von Reddit, TikTok und YouTube.
- Reise- und Preisaggregation – Erstellen Sie Tools, die Live-Preise und Verfügbarkeiten über Websites hinweg sammeln.
Schnellstart
- Erstellen Sie ein kostenloses Konto unter dashboard.decodo.com – bis zu 2.000 kostenlose Anfragen, keine Kreditkarte erforderlich.
- Holen Sie sich Ihren API-Schlüssel. Beziehen Sie ein Basic-Authentication-Token für die Web Scraping API aus dem Dashboard.
- Laden Sie Node.js 18+ herunter von https://nodejs.org.
- Besorgen Sie sich einen MCP-Client wie Claude Desktop, Cursor, Windsurf oder andere MCP-kompatible Tools.
- Konfigurieren Sie den MCP-Server in Ihrem KI-Client (siehe Konfigurationsbeispiele unten).
Verbindung zum Decodo MCP Server
Öffnen Sie Ihren bevorzugten MCP-Client und fügen Sie die folgende Konfiguration hinzu (siehe Beispiele für Claude Code, Cursor, Windsurf unten):
{
"mcpServers": {
"Decodo": {
"url": "https://mcp.decodo.com/mcp",
"headers": {
"Authorization": "Basic <basic_auth_token>"
}
}
}
}
Claude Desktop
- Öffnen Sie Claude Desktop → Einstellungen → Entwickler → Konfiguration bearbeiten.
- Fügen Sie in claude_desktop_config.json hinzu:
{
"mcpServers": {
"Decodo": {
"command": "npx",
"args": ["-y", "@decodo/mcp-server"],
"env": {
"SCRAPER_API_TOKEN": "<basic_auth_token>",
"TOOLSETS": "web,ai"
}
}
}
}
- Speichern und Claude Desktop neu starten.
Cursor
- Öffnen Sie Einstellungen → MCP.
- Klicken Sie auf „Neuen globalen MCP-Server hinzufügen“ (öffnet mcp.json).
- Fügen Sie dieselbe Konfiguration wie oben hinzu.
- Speichern – achten Sie auf eine grüne Statusanzeige neben Decodo.
Windsurf
- Öffnen Sie Einstellungen → Windsurf-Einstellungen.
- Scrollen Sie zu Cascade → „Benutzerdefinierten Server hinzufügen“ + (öffnet mcp_config.json).
- Fügen Sie dieselbe Konfiguration wie oben hinzu.
- Speichern und Windsurf neu starten.
Testen Sie Ihr Setup
Sobald die Verbindung hergestellt ist, versuchen Sie diesen Prompt in Ihrem Client:
▎ "Scrape die Titel der Top-5-Artikel von Hacker News"
Sie sollten innerhalb von Sekunden eine strukturierte Liste zurückerhalten. Wenn Sie einen Authentifizierungsfehler sehen, überprüfen Sie Ihr Token im Dashboard.
Optional: Aktivieren bestimmter Toolsets
Lokales Ausführen des MCP-Servers
Voraussetzungen
- Node.js 18.0+
- Ein MCP-Client – beliebte Optionen sind Claude Desktop und Cursor
Schritt-für-Schritt-Anleitung
- Klonen Sie dieses Repository:
git clone https://github.com/Decodo/mcp-server
- Führen Sie die folgenden Befehle im Terminal aus:
cd decodo-mcp-server
npm install
npm run build
- Notieren Sie sich Ihren Build-Speicherort:
cd build/
pwd
Wenn Sie index.js an das Ende dieses Verzeichnisses anhängen, sollte Ihr Build-Dateipfad etwa so aussehen:
/Users/your.user/projects/decodo-mcp/build/index.js
- Aktualisieren Sie Ihren MCP-Client mit den Serverinformationen:
{
"mcpServers": {
"decodo-mcp": {
"command": "node",
"args": ["/Users/your.user/projects/decodo-mcp/build/index.js"],
"env": {
"SCRAPER_API_TOKEN": "<web_scraping_api_base64_token>"
}
}
}
}
Toolsets
Tools sind in Toolsets organisiert. Sie können bestimmte Toolsets gezielt aktivieren, indem Sie eine
durch Kommas getrennte Liste über den Abfrageparameter toolsets übergeben:
"Decodo MCP Server": {
"url": "https://mcp.decodo.com/mcp?toolsets=web,ai",
"headers": {
"Authorization": "Basic <your_auth_token>"
}
}
Wenn keine Toolsets angegeben sind, werden alle Tools registriert.
| Toolset | Tools |
|---|---|
web | scrape_as_markdown, screenshot |
search | google_search, google_ads, google_lens, google_travel_hotels, bing_search |
ecommerce | amazon_search, amazon_product, amazon_pricing, amazon_sellers, amazon_bestsellers, walmart_search, walmart_product, target_search, target_product, tiktok_shop_search, tiktok_shop_product, tiktok_shop_url |
social_media | reddit_post, reddit_subreddit, reddit_user, tiktok_post, youtube_metadata, youtube_channel, youtube_subtitles, youtube_search |
ai | chatgpt, perplexity, google_ai_mode |
Tools
Der Server stellt die folgenden Tools bereit:
| Tool | Beschreibung | Beispiel-Prompt |
|---|---|---|
scrape_as_markdown | Scraped eine beliebige Ziel-URL, erwartet eine URL im Prompt. Gibt Ergebnisse in Markdown zurück. | Scrape peacock.com von einer US-IP-Adresse und nenne mir die Preise. |
screenshot | Erstellt einen Screenshot einer beliebigen Webseite und gibt ihn als PNG-Bild zurück. | Mache einen Screenshot von github.com von einer US-IP-Adresse. |
google_search | Durchsucht Google Search nach einer bestimmten Anfrage und gibt geparste Ergebnisse zurück. | Durchsuche Google Search nach Schuhen und nenne mir die Top-Position. |
google_ads | Scraped Google Ads-Suchergebnisse. | Scrape Google Ads für Laptop und zeige mir die Top-Anzeigen. |
google_lens | Scraped Google Lens-Bildersuchergebnisse. | Suche mit Google Lens nach diesem Bild: https://example.com/image.jpg |
google_ai_mode | Scraped Google AI Mode (Search with AI)-Ergebnisse. | Frage Google AI Mode: Was sind die drei beliebtesten Hunderassen? |
google_travel_hotels | Scraped Google Travel Hotels-Suchergebnisse. | Suche mit Google Travel Hotels nach Hotels in Paris. |
amazon_search | Durchsucht Amazon Search nach einer bestimmten Anfrage und gibt geparste Ergebnisse zurück. | Durchsuche Amazon Search nach kabelloser Tastatur. |
amazon_product | Scraped eine Amazon-Produktseite. | Scrape das Amazon-Produkt B09H74FXNW und zeige mir die Details. |
amazon_pricing | Scraped Amazon-Produktpreisinformationen. | Rufe die Preisinformationen für das Amazon-Produkt B09H74FXNW ab. |
amazon_sellers | Scraped Amazon-Verkäuferinformationen. | Rufe Informationen über den Amazon-Verkäufer A1R0Z7FJGTKESH ab. |
amazon_bestsellers | Scraped die Amazon-Bestsellerliste. | Zeige mir die Amazon-Bestseller im Bereich Elektronik. |
walmart_search | Durchsucht Walmart Search nach einer bestimmten Anfrage und gibt geparste Ergebnisse zurück. | Durchsuche Walmart Search nach Campingzelt. |
walmart_product | Scraped eine Walmart-Produktseite. | Scrape das Walmart-Produkt 15296401808. |
target_search | Durchsucht Target Search nach einer bestimmten Anfrage und gibt geparste Ergebnisse zurück. | Durchsuche Target Search nach Küchengeräten. |
target_product | Scraped eine Target-Produktseite. | Scrape das Target-Produkt 92186007. |
tiktok_post | Scraped eine TikTok-Post-URL für strukturierte Daten (z. B. Engagement, Beschreibung, Hashtags). | Scrape diesen TikTok-Post: https://www.tiktok.com/@nba/video/7393013274725403950 |
tiktok_shop_search | Durchsucht TikTok Shop Search nach einer bestimmten Anfrage und gibt geparste Ergebnisse zurück. | Durchsuche TikTok Shop Search nach Handyhüllen. |
tiktok_shop_product | Scraped eine TikTok Shop-Produktseite. | Scrape das TikTok Shop-Produkt 1731541214379741272. |
tiktok_shop_url | Scraped eine TikTok Shop-Seite anhand der URL. | Scrape diese TikTok Shop-URL: https://www.tiktok.com/shop/s?q=HEADPHONES |
youtube_metadata | Scraped YouTube-Videometadaten. | Rufe Metadaten für das YouTube-Video dFu9aKJoqGg ab. |
youtube_channel | Scraped YouTube-Kanalvideos. | Scrape den YouTube-Kanal @decodo_official. |
youtube_subtitles | Scraped YouTube-Videountertitel. | Rufe Untertitel für das YouTube-Video L8zSWbQN-v8 ab. |
youtube_search | Durchsucht YouTube-Videos. | Suche auf YouTube nach "How to care for chinchillas". |
reddit_post | Scraped einen bestimmten Reddit-Beitrag. | Scrape den folgenden Reddit-Beitrag: https://www.reddit.com/r/horseracing/comments/1nsrn3/ |
reddit_subreddit | Scraped Reddit-Subreddit-Ergebnisse. | Scrape die Top-5-Beiträge auf r/Python diese Woche. |
reddit_user | Scraped ein Reddit-Benutzerprofil und dessen Beiträge/Kommentare. | Scrape diesen Reddit-Benutzer: https://www.reddit.com/user/IWasRightOnce/ |
bing_search | Scraped Bing Search-Ergebnisse. | Suche mit Bing nach Laptop-Reviews. |
chatgpt | Suche und interagiere mit ChatGPT für KI-gestützte Antworten und Konversationen. | Bitte ChatGPT, Quantencomputing in einfachen Worten zu erklären. |
perplexity | Suche und interagiere mit Perplexity für KI-gestützte Antworten und Konversationen. | Frage Perplexity nach den neuesten Trends in der Webentwicklung. |
Parameter
Die folgenden Parameter werden aus Benutzer-Prompts abgeleitet:
| Parameter | Beschreibung |
|---|---|
jsRender | Rendert die Ziel-URL in einem Headless-Browser. |
geo | Legt das Land fest, aus dem die Anfrage stammen soll. |
locale | Legt das Gebietsschema der Anfrage fest. |
tokenLimit | Kürzt den Antwortinhalt bis zu diesem Limit. Nützlich, wenn das Kontextfenster klein ist. |
prompt | Prompt, der an KI-Tools gesendet werden soll (chatgpt, perplexity). |
search | Aktiviert die Websuchfunktion von ChatGPT (nur chatgpt). |
xhr | Wenn true, werden XHR- oder Fetch-Antworten in das Scrape-Ergebnis einbezogen, sofern unterstützt (z. B. tiktok_post). |
deviceType | Gerätetyp, der für die Anfrage emuliert werden soll (desktop, mobile, tablet). |
domain | Für die Anfrage zu verwendende Domain (z. B. amazon.com, amazon.co.uk, bing.com). |
pageFrom | Startseitennummer für die Paginierung. |
deliveryZip | Postleitzahl für den Lieferort (Target, Walmart). |
storeId | Store-ID für den lokalen Bestand (Target, Walmart). |
country | Land für TikTok Shop-Anfragen. |
limit | Maximale Anzahl der zurückzugebenden Ergebnisse (z. B. YouTube-Kanalvideos). |
language_code | Sprachcode für Untertitel (z. B. en, es). |
Beispiele
Scraping von geografisch eingeschränkten Inhalten
Fragen Sie Ihren KI-Agenten mit folgendem Prompt:
Scrape peacock.com from a German IP address and tell me the pricing.
Dieser Prompt wird anzeigen, dass peacock.com geografisch eingeschränkt ist. Um die Geobeschränkung zu umgehen:
Scrape peacock.com from a US IP address and tell me the pricing.
Begrenzung der Anzahl der Antwort-Tokens
Wenn Ihr Agent ein kleines Kontextfenster hat, wird der vom Scraping zurückgegebene Inhalt automatisch gekürzt, um einen Kontextüberlauf zu vermeiden. Sie können die Anzahl der zurückgegebenen Tokens in Ihrem Prompt erhöhen:
Scrape hacker news, return 50k tokens.
Wenn Ihr Agent ein großes Kontextfenster hat, weisen Sie ihn an, full content zurückzugeben:
Scrape hacker news, return full content.
Verwandte Repositories
Web Scraping API, Decodo OpenClaw skill
Ausprobieren
Integrieren Sie den Decodo MCP Server mit nur wenigen Klicks in Ihren KI-Workflow und statten Sie Ihre KI-Agenten mit Echtzeitdaten von jeder Website aus.
Kostenlos starten | Dokumentation | Discord
Lizenz
Der gesamte Code wird unter der MIT-Lizenz veröffentlicht.