Scrapeless MCP Server

resmi

Integrasikan hasil Google SERP real-time dari Scrapeless (Google Search, Google Flight, Google Map, Google Jobs, dll.) ke dalam aplikasi LLM Anda. Server ini memungkinkan pengambilan konteks dinamis untuk alur kerja AI, chatbot, dan alat riset.

GitHub

162

Dokumentasi

Scrapeless MCP Server

Selamat datang di Scrapeless Model Context Protocol (MCP) Server resmi — lapisan integrasi canggih yang memberdayakan LLM, Agen AI, dan aplikasi AI untuk berinteraksi dengan web secara real time.

Dibangun berdasarkan standar MCP terbuka, Scrapeless MCP Server menghubungkan model seperti ChatGPT, Claude, serta alat seperti Cursor dan Windsurf ke berbagai kemampuan eksternal, termasuk:

Integrasi layanan Google (Search, Trends)
Otomasi browser untuk navigasi dan interaksi tingkat halaman
Scrape situs dinamis dengan JavaScript berat—ekspor sebagai HTML, Markdown, atau tangkapan layar

Baik Anda membangun asisten riset AI, copilot pengkodean, atau agen web otonom, server ini menyediakan konteks dinamis dan data dunia nyata yang dibutuhkan alur kerja Anda—tanpa diblokir.

Contoh Penggunaan

Interaksi Web Otomatis dan Ekstraksi Data dengan Claude

Menggunakan Scrapeless MCP Browser, Claude dapat melakukan tugas kompleks seperti navigasi web, mengklik, menggulir, dan scraping melalui perintah percakapan, dengan pratinjau real-time hasil interaksi web melalui live sessions.

preview

Melewati Cloudflare untuk Mengambil Konten Halaman Target

Menggunakan layanan Scrapeless MCP Browser, halaman Cloudflare diakses secara otomatis, dan setelah proses selesai, konten halaman diekstraksi dan dikembalikan dalam format Markdown.

preview

Mengekstrak Konten Halaman yang Dirender Dinamis dan Menulis ke File

Menggunakan Scrapeless MCP Universal API, konten yang dirender JavaScript dari halaman target di atas di-scrape, diekspor dalam format Markdown, dan akhirnya ditulis ke file lokal bernama text.md.

preview

Scraping SERP Otomatis

Menggunakan Scrapeless MCP Server, kueri kata kunci “web scraping” di Google Search, ambil 10 hasil pencarian pertama (termasuk judul, tautan, dan ringkasan), dan tulis kontennya ke file bernama serp.text.

preview

Berikut beberapa contoh tambahan tentang cara menggunakan server ini:

Contoh
Cari scrapeless dengan pencarian Google.
Temukan minat pencarian untuk "AI" selama setahun terakhir.
Gunakan browser untuk mengunjungi chatgpt.com, cari "Bagaimana cuaca hari ini?", dan ringkas hasilnya.
Scrape konten HTML halaman scrapeless.com.
Scrape konten Markdown halaman scrapeless.com.
Dapatkan tangkapan layar scrapeless.com.

Panduan Pengaturan

Dapatkan Kunci Scrapeless

Masuk ke Dasbor Scrapeless (Uji coba gratis tersedia)
Lalu klik "Pengaturan" di sebelah kiri -> pilih "Manajemen Kunci API" -> klik "Buat Kunci API". Terakhir, klik Kunci API yang Anda buat untuk menyalinnya.

preview

Konfigurasikan Klien MCP Anda

Scrapeless MCP Server mendukung mode transport Stdio dan Streamable HTTP.

🖥️ Stdio (Eksekusi Lokal)

{
  "mcpServers": {
    "Scrapeless MCP Server": {
      "command": "npx",
      "args": ["-y", "scrapeless-mcp-server"],
      "env": {
        "SCRAPELESS_KEY": "YOUR_SCRAPELESS_KEY"
      }
    }
  }
}

🌐 Streamable HTTP (Mode API Terhosting)

{
  "mcpServers": {
    "Scrapeless MCP Server": {
      "type": "streamable-http",
      "url": "https://api.scrapeless.com/mcp",
      "headers": {
        "x-api-token": "YOUR_SCRAPELESS_KEY"
      },
      "disabled": false,
      "alwaysAllow": []
    }
  }
}

Opsi Lanjutan

Sesuaikan perilaku sesi browser dengan parameter opsional. Ini dapat diatur melalui variabel lingkungan (untuk Stdio) atau header HTTP (untuk Streamable HTTP):

Stdio (Var Lingkungan)	Streamable HTTP (Header HTTP)	Deskripsi
BROWSER_PROFILE_ID	x-browser-profile-id	Menentukan ID profil browser yang dapat digunakan kembali untuk kontinuitas sesi.
BROWSER_PROFILE_PERSIST	x-browser-profile-persist	Mengaktifkan penyimpanan persisten untuk cookie, penyimpanan lokal, dll.
BROWSER_SESSION_TTL	x-browser-session-ttl	Menentukan batas waktu sesi maksimum dalam detik. Sesi akan otomatis berakhir setelah durasi tidak aktif ini.

Integrasi dengan Claude Desktop

Buka Claude Desktop
Arahkan ke: Settings → Tools → MCP Servers
Klik "Tambahkan MCP Server"
Tempelkan konfigurasi Stdio atau Streamable HTTP di atas
Simpan dan aktifkan server
Claude sekarang dapat mengeluarkan kueri web, mengekstrak konten, dan berinteraksi dengan halaman menggunakan Scrapeless

Integrasi dengan Cursor IDE

Buka Cursor
Tekan Cmd + Shift + P dan cari: Configure MCP Servers
Tambahkan konfigurasi Scrapeless MCP menggunakan format di atas
Simpan file dan mulai ulang Cursor (jika perlu)
Sekarang Anda dapat menanyakan hal-hal seperti ini kepada Cursor:
1. "Search StackOverflow for a solution to this error"
2. "Scrape the HTML from this page"
Dan itu akan menggunakan Scrapeless di latar belakang.

Alat MCP yang Didukung

Nama	Deskripsi
google_search	Mesin pencari informasi universal.
google_trends	Dapatkan data pencarian trending dari Google Trends.
browser_create	Buat atau gunakan kembali sesi browser cloud menggunakan Scrapeless.
browser_close	Menutup sesi saat ini dengan memutuskan browser cloud.
browser_goto	Arahkan browser ke URL yang ditentukan.
browser_go_back	Mundur satu langkah dalam riwayat browser.
browser_go_forward	Maju satu langkah dalam riwayat browser.
browser_click	Klik elemen tertentu di halaman.
browser_type	Ketik teks ke dalam bidang input yang ditentukan.
browser_press_key	Simulasikan penekanan tombol.
browser_wait_for	Tunggu hingga elemen halaman tertentu muncul.
browser_wait	Jeda eksekusi untuk durasi tetap.
browser_screenshot	Tangkap tangkapan layar halaman saat ini.
browser_get_html	Dapatkan HTML lengkap dari halaman saat ini.
browser_get_text	Dapatkan semua teks yang terlihat dari halaman saat ini.
browser_scroll	Gulir ke bagian bawah halaman.
browser_scroll_to	Gulir elemen tertentu ke dalam tampilan.
scrape_html	Scrape URL dan kembalikan konten HTML lengkapnya.
scrape_markdown	Scrape URL dan kembalikan kontennya sebagai Markdown.
scrape_screenshot	Tangkap tangkapan layar berkualitas tinggi dari halaman web mana pun.

Praktik Terbaik Keamanan

Saat menggunakan Scrapeless MCP Server dengan LLM (seperti ChatGPT, Claude, atau Cursor), sangat penting untuk menangani semua konten web yang di-scrape atau diekstraksi dengan hati-hati. Data web tidak tepercaya secara default, dan penanganan yang tidak tepat dapat mengekspos aplikasi Anda terhadap injeksi prompt atau kerentanan keamanan lainnya.

✅ Praktik yang Direkomendasikan

Jangan pernah meneruskan konten mentah yang di-scrape langsung ke prompt LLM. HTML mentah, JavaScript, atau teks buatan pengguna mungkin berisi muatan injeksi tersembunyi.
Sanitasi dan validasi semua konten yang diekstraksi. Hapus atau escape tag dan skrip yang berpotensi berbahaya sebelum menggunakan konten dalam logika hilir atau model AI.
Utamakan ekstraksi terstruktur daripada teks bebas. Gunakan alat seperti scrape_html, scrape_markdown, atau browser_get_text yang ditargetkan dengan pemilih yang dikenal aman untuk hanya mengekstrak konten yang Anda percayai.
Terapkan whitelisting domain atau pemilih saat scraping halaman yang dihasilkan secara dinamis, untuk membatasi aliran data ke sumber yang dikenal dan tepercaya.
Catat dan pantau semua permintaan keluar yang dibuat melalui alat browser atau scraping, terutama jika Anda menangani data sensitif, token, atau akses jaringan internal.

🚫 Hindari

Menyuntikkan HTML yang di-scrape langsung ke prompt
Membiarkan pengguna menentukan URL arbitrer atau pemilih CSS tanpa validasi
Menyimpan konten yang di-scrape tanpa filter untuk penggunaan prompt di masa mendatang

Komunitas

Discord MCP Server

Hubungi Kami

Untuk pertanyaan, saran, atau permintaan kolaborasi, jangan ragu untuk menghubungi kami melalui:

Email: [email protected]
Situs Web Resmi: https://www.scrapeless.com
Forum Komunitas: https://discord.gg/Np4CAHxB9a