Scrapeless MCP Server

आधिकारिक

अपने LLM अनुप्रयोगों में रीयल-टाइम Scrapeless Google SERP (Google Search, Google Flight, Google Map, Google Jobs....) परिणामों को एकीकृत करें। यह सर्वर AI वर्कफ़्लो, चैटबॉट और अनुसंधान उपकरणों के लिए गतिशील संदर्भ पुनर्प्राप्ति सक्षम करता है।

GitHub

162

दस्तावेज़

Scrapeless MCP सर्वर

आधिकारिक Scrapeless मॉडल संदर्भ प्रोटोकॉल (MCP) सर्वर में आपका स्वागत है — एक शक्तिशाली एकीकरण परत जो LLM, AI एजेंट और AI अनुप्रयोगों को वास्तविक समय में वेब के साथ इंटरैक्ट करने की शक्ति देती है।

खुले MCP मानक पर निर्मित, Scrapeless MCP सर्वर ChatGPT, Claude जैसे मॉडलों और Cursor तथा Windsurf जैसे उपकरणों को व्यापक बाहरी क्षमताओं से सहजता से जोड़ता है, जिनमें शामिल हैं:

Google सेवाएं एकीकरण (खोज, रुझान)
पृष्ठ-स्तरीय नेविगेशन और इंटरैक्शन के लिए ब्राउज़र स्वचालन
गतिशील, JS-भारी साइटों को स्क्रैप करें—HTML, Markdown या स्क्रीनशॉट के रूप में निर्यात करें

चाहे आप एक AI अनुसंधान सहायक, एक कोडिंग सह-पायलट, या स्वायत्त वेब एजेंट बना रहे हों, यह सर्वर आपके वर्कफ़्लो के लिए आवश्यक गतिशील संदर्भ और वास्तविक दुनिया का डेटा प्रदान करता है—बिना ब्लॉक हुए।

उपयोग के उदाहरण

Claude के साथ स्वचालित वेब इंटरैक्शन और डेटा निष्कर्षण

Scrapeless MCP ब्राउज़र का उपयोग करके, Claude वार्तालाप आदेशों के माध्यम से वेब नेविगेशन, क्लिक करना, स्क्रॉल करना और स्क्रैपिंग जैसे जटिल कार्य कर सकता है, जिसमें live sessions के माध्यम से वेब इंटरैक्शन परिणामों का वास्तविक समय पूर्वावलोकन होता है।

preview

लक्ष्य पृष्ठ सामग्री प्राप्त करने के लिए Cloudflare को बायपास करना

Scrapeless MCP ब्राउज़र सेवा का उपयोग करके, Cloudflare पृष्ठ स्वचालित रूप से एक्सेस किया जाता है, और प्रक्रिया पूरी होने के बाद, पृष्ठ सामग्री निकाली जाती है और Markdown प्रारूप में लौटाई जाती है।

preview

गतिशील रूप से रेंडर की गई पृष्ठ सामग्री निकालना और फ़ाइल में लिखना

Scrapeless MCP यूनिवर्सल API का उपयोग करके, उपरोक्त लक्ष्य पृष्ठ की JavaScript-रेंडर की गई सामग्री को स्क्रैप किया जाता है, Markdown प्रारूप में निर्यात किया जाता है, और अंत में text.md नामक स्थानीय फ़ाइल में लिखा जाता है।

preview

स्वचालित SERP स्क्रैपिंग

Scrapeless MCP सर्वर का उपयोग करके, Google खोज पर "वेब स्क्रैपिंग" कीवर्ड क्वेरी करें, पहले 10 खोज परिणाम (शीर्षक, लिंक और सारांश सहित) प्राप्त करें, और सामग्री को serp.text नामक फ़ाइल में लिखें।

preview

इन सर्वरों का उपयोग करने के कुछ अतिरिक्त उदाहरण यहां दिए गए हैं:

उदाहरण
Google खोज द्वारा scrapeless खोजें।
पिछले वर्ष में "AI" के लिए खोज रुचि का पता लगाएं।
chatgpt.com पर जाने के लिए ब्राउज़र का उपयोग करें, "आज मौसम कैसा है?" खोजें, और परिणामों को सारांशित करें।
scrapeless.com पृष्ठ की HTML सामग्री स्क्रैप करें।
scrapeless.com पृष्ठ की Markdown सामग्री स्क्रैप करें।
scrapeless.com के स्क्रीनशॉट प्राप्त करें।

सेटअप गाइड

Scrapeless कुंजी प्राप्त करें

Scrapeless डैशबोर्ड में लॉग इन करें (निःशुल्क परीक्षण उपलब्ध)
फिर बाईं ओर "सेटिंग" पर क्लिक करें -> "API कुंजी प्रबंधन" चुनें -> "API कुंजी बनाएं" पर क्लिक करें। अंत में, इसे कॉपी करने के लिए आपके द्वारा बनाई गई API कुंजी पर क्लिक करें।

preview

अपना MCP क्लाइंट कॉन्फ़िगर करें

Scrapeless MCP सर्वर Stdio और स्ट्रीमेबल HTTP दोनों परिवहन मोड का समर्थन करता है।

🖥️ Stdio (स्थानीय निष्पादन)

{
  "mcpServers": {
    "Scrapeless MCP Server": {
      "command": "npx",
      "args": ["-y", "scrapeless-mcp-server"],
      "env": {
        "SCRAPELESS_KEY": "YOUR_SCRAPELESS_KEY"
      }
    }
  }
}

🌐 स्ट्रीमेबल HTTP (होस्टेड API मोड)

{
  "mcpServers": {
    "Scrapeless MCP Server": {
      "type": "streamable-http",
      "url": "https://api.scrapeless.com/mcp",
      "headers": {
        "x-api-token": "YOUR_SCRAPELESS_KEY"
      },
      "disabled": false,
      "alwaysAllow": []
    }
  }
}

उन्नत विकल्प

वैकल्पिक पैरामीटर के साथ ब्राउज़र सत्र व्यवहार को अनुकूलित करें। इन्हें पर्यावरण चर (Stdio के लिए) या HTTP हेडर (स्ट्रीमेबल HTTP के लिए) के माध्यम से सेट किया जा सकता है:

Stdio (Env Var)	स्ट्रीमेबल HTTP (HTTP हेडर)	विवरण
BROWSER_PROFILE_ID	x-browser-profile-id	सत्र निरंतरता के लिए एक पुन: प्रयोज्य ब्राउज़र प्रोफ़ाइल ID निर्दिष्ट करता है।
BROWSER_PROFILE_PERSIST	x-browser-profile-persist	कुकीज़, स्थानीय भंडारण आदि के लिए स्थायी भंडारण सक्षम करता है।
BROWSER_SESSION_TTL	x-browser-session-ttl	सेकंड में अधिकतम सत्र समयबाह्य को परिभाषित करता है। निष्क्रियता की इस अवधि के बाद सत्र स्वचालित रूप से समाप्त हो जाएगा।

Claude डेस्कटॉप के साथ एकीकरण

Claude डेस्कटॉप खोलें
यहां नेविगेट करें: Settings → Tools → MCP Servers
"MCP सर्वर जोड़ें" पर क्लिक करें
उपरोक्त Stdio या Streamable HTTP कॉन्फ़िगरेशन में से कोई एक पेस्ट करें
सहेजें और सर्वर सक्षम करें
Claude अब Scrapeless का उपयोग करके वेब क्वेरी जारी करने, सामग्री निकालने और पृष्ठों के साथ इंटरैक्ट करने में सक्षम होगा

Cursor IDE के साथ एकीकरण

Cursor खोलें
Cmd + Shift + P दबाएं और खोजें: Configure MCP Servers
उपरोक्त प्रारूप का उपयोग करके Scrapeless MCP कॉन्फ़िगरेशन जोड़ें
फ़ाइल सहेजें और Cursor को पुनरारंभ करें (यदि आवश्यक हो)
अब आप Cursor से ऐसी चीज़ें पूछ सकते हैं:
1. "Search StackOverflow for a solution to this error"
2. "Scrape the HTML from this page"
और यह पृष्ठभूमि में Scrapeless का उपयोग करेगा।

समर्थित MCP उपकरण

नाम	विवरण
google_search	सार्वभौमिक सूचना खोज इंजन।
google_trends	Google रुझान से ट्रेंडिंग खोज डेटा प्राप्त करें।
browser_create	Scrapeless का उपयोग करके क्लाउड ब्राउज़र सत्र बनाएं या पुन: उपयोग करें।
browser_close	क्लाउड ब्राउज़र को डिस्कनेक्ट करके वर्तमान सत्र बंद करता है।
browser_goto	ब्राउज़र को निर्दिष्ट URL पर नेविगेट करें।
browser_go_back	ब्राउज़र इतिहास में एक कदम पीछे जाएं।
browser_go_forward	ब्राउज़र इतिहास में एक कदम आगे बढ़ें।
browser_click	पृष्ठ पर किसी विशिष्ट तत्व पर क्लिक करें।
browser_type	निर्दिष्ट इनपुट फ़ील्ड में टेक्स्ट टाइप करें।
browser_press_key	एक कुंजी दबाने का अनुकरण करें।
browser_wait_for	किसी विशिष्ट पृष्ठ तत्व के प्रकट होने की प्रतीक्षा करें।
browser_wait	एक निश्चित अवधि के लिए निष्पादन रोकें।
browser_screenshot	वर्तमान पृष्ठ का स्क्रीनशॉट कैप्चर करें।
browser_get_html	वर्तमान पृष्ठ का पूर्ण HTML प्राप्त करें।
browser_get_text	वर्तमान पृष्ठ से सभी दृश्यमान टेक्स्ट प्राप्त करें।
browser_scroll	पृष्ठ के निचले भाग तक स्क्रॉल करें।
browser_scroll_to	किसी विशिष्ट तत्व को दृश्य में स्क्रॉल करें।
scrape_html	एक URL स्क्रैप करें और उसकी पूर्ण HTML सामग्री लौटाएं।
scrape_markdown	एक URL स्क्रैप करें और उसकी सामग्री Markdown के रूप में लौटाएं।
scrape_screenshot	किसी भी वेबपेज का उच्च-गुणवत्ता वाला स्क्रीनशॉट कैप्चर करें।

सुरक्षा सर्वोत्तम अभ्यास

LLM (जैसे ChatGPT, Claude, या Cursor) के साथ Scrapeless MCP सर्वर का उपयोग करते समय, सभी स्क्रैप या निकाली गई वेब सामग्री को सावधानी से संभालना महत्वपूर्ण है। वेब डेटा डिफ़ॉल्ट रूप से अविश्वसनीय है, और अनुचित हैंडलिंग आपके एप्लिकेशन को प्रॉम्प्ट इंजेक्शन या अन्य सुरक्षा कमजोरियों के प्रति उजागर कर सकती है।

✅ अनुशंसित अभ्यास

कच्ची स्क्रैप की गई सामग्री को सीधे LLM प्रॉम्प्ट में कभी न डालें। कच्चे HTML, JavaScript, या उपयोगकर्ता-जनित टेक्स्ट में छिपे हुए इंजेक्शन पेलोड हो सकते हैं।
सभी निकाली गई सामग्री को सैनिटाइज़ और मान्य करें। डाउनस्ट्रीम लॉजिक या AI मॉडल में सामग्री का उपयोग करने से पहले संभावित हानिकारक टैग और स्क्रिप्ट को हटा दें या एस्केप करें।
मुक्त-रूप टेक्स्ट पर संरचित निष्कर्षण को प्राथमिकता दें। केवल उस सामग्री को निकालने के लिए जिस पर आप भरोसा करते हैं, ज्ञात-सुरक्षित चयनकर्ताओं के साथ scrape_html, scrape_markdown, या लक्षित browser_get_text जैसे उपकरणों का उपयोग करें।
गतिशील रूप से उत्पन्न पृष्ठों को स्क्रैप करते समय डोमेन या चयनकर्ता श्वेतसूचीकरण लागू करें, ताकि डेटा प्रवाह को ज्ञात और विश्वसनीय स्रोतों तक सीमित किया जा सके।
ब्राउज़र या स्क्रैपिंग उपकरणों के माध्यम से किए गए सभी आउटबाउंड अनुरोधों को लॉग और मॉनिटर करें, खासकर यदि आप संवेदनशील डेटा, टोकन, या आंतरिक नेटवर्क एक्सेस को संभाल रहे हैं।

🚫 बचें

स्क्रैप किए गए HTML को सीधे प्रॉम्प्ट में इंजेक्ट करना
उपयोगकर्ताओं को सत्यापन के बिना मनमाने URL या CSS चयनकर्ता निर्दिष्ट करने देना
भविष्य के प्रॉम्प्ट उपयोग के लिए अनफ़िल्टर्ड स्क्रैप की गई सामग्री संग्रहीत करना

समुदाय

MCP सर्वर Discord

हमसे संपर्क करें

प्रश्नों, सुझावों या सहयोग पूछताछ के लिए, बेझिझक हमसे संपर्क करें:

ईमेल: [email protected]
आधिकारिक वेबसाइट: https://www.scrapeless.com
सामुदायिक मंच: https://discord.gg/Np4CAHxB9a