Scrapeless MCP Server

resmi

Integrasikan hasil Google SERP real-time dari Scrapeless (Google Search, Google Flight, Google Map, Google Jobs, dll.) ke dalam aplikasi LLM Anda. Server ini memungkinkan pengambilan konteks dinamis untuk alur kerja AI, chatbot, dan alat riset.

Dokumentasi

preview

Scrapeless MCP Server

Selamat datang di Scrapeless Model Context Protocol (MCP) Server resmi — lapisan integrasi canggih yang memberdayakan LLM, Agen AI, dan aplikasi AI untuk berinteraksi dengan web secara real time.

Dibangun berdasarkan standar MCP terbuka, Scrapeless MCP Server menghubungkan model seperti ChatGPT, Claude, serta alat seperti Cursor dan Windsurf ke berbagai kemampuan eksternal, termasuk:

  • Integrasi layanan Google (Search, Trends)
  • Otomasi browser untuk navigasi dan interaksi tingkat halaman
  • Scrape situs dinamis dengan JavaScript berat—ekspor sebagai HTML, Markdown, atau tangkapan layar

Baik Anda membangun asisten riset AI, copilot pengkodean, atau agen web otonom, server ini menyediakan konteks dinamis dan data dunia nyata yang dibutuhkan alur kerja Anda—tanpa diblokir.

Contoh Penggunaan

  1. Interaksi Web Otomatis dan Ekstraksi Data dengan Claude

Menggunakan Scrapeless MCP Browser, Claude dapat melakukan tugas kompleks seperti navigasi web, mengklik, menggulir, dan scraping melalui perintah percakapan, dengan pratinjau real-time hasil interaksi web melalui live sessions.

preview

  1. Melewati Cloudflare untuk Mengambil Konten Halaman Target

Menggunakan layanan Scrapeless MCP Browser, halaman Cloudflare diakses secara otomatis, dan setelah proses selesai, konten halaman diekstraksi dan dikembalikan dalam format Markdown.

preview

  1. Mengekstrak Konten Halaman yang Dirender Dinamis dan Menulis ke File

Menggunakan Scrapeless MCP Universal API, konten yang dirender JavaScript dari halaman target di atas di-scrape, diekspor dalam format Markdown, dan akhirnya ditulis ke file lokal bernama text.md.

preview

  1. Scraping SERP Otomatis

Menggunakan Scrapeless MCP Server, kueri kata kunci “web scraping” di Google Search, ambil 10 hasil pencarian pertama (termasuk judul, tautan, dan ringkasan), dan tulis kontennya ke file bernama serp.text.

preview

Berikut beberapa contoh tambahan tentang cara menggunakan server ini:

Contoh
Cari scrapeless dengan pencarian Google.
Temukan minat pencarian untuk "AI" selama setahun terakhir.
Gunakan browser untuk mengunjungi chatgpt.com, cari "Bagaimana cuaca hari ini?", dan ringkas hasilnya.
Scrape konten HTML halaman scrapeless.com.
Scrape konten Markdown halaman scrapeless.com.
Dapatkan tangkapan layar scrapeless.com.

Panduan Pengaturan

  1. Dapatkan Kunci Scrapeless
  • Masuk ke Dasbor Scrapeless (Uji coba gratis tersedia)
  • Lalu klik "Pengaturan" di sebelah kiri -> pilih "Manajemen Kunci API" -> klik "Buat Kunci API". Terakhir, klik Kunci API yang Anda buat untuk menyalinnya.

preview

  1. Konfigurasikan Klien MCP Anda

Scrapeless MCP Server mendukung mode transport Stdio dan Streamable HTTP.

🖥️ Stdio (Eksekusi Lokal)

{
  "mcpServers": {
    "Scrapeless MCP Server": {
      "command": "npx",
      "args": ["-y", "scrapeless-mcp-server"],
      "env": {
        "SCRAPELESS_KEY": "YOUR_SCRAPELESS_KEY"
      }
    }
  }
}

🌐 Streamable HTTP (Mode API Terhosting)

{
  "mcpServers": {
    "Scrapeless MCP Server": {
      "type": "streamable-http",
      "url": "https://api.scrapeless.com/mcp",
      "headers": {
        "x-api-token": "YOUR_SCRAPELESS_KEY"
      },
      "disabled": false,
      "alwaysAllow": []
    }
  }
}

Opsi Lanjutan

Sesuaikan perilaku sesi browser dengan parameter opsional. Ini dapat diatur melalui variabel lingkungan (untuk Stdio) atau header HTTP (untuk Streamable HTTP):

Stdio (Var Lingkungan)Streamable HTTP (Header HTTP)Deskripsi
BROWSER_PROFILE_IDx-browser-profile-idMenentukan ID profil browser yang dapat digunakan kembali untuk kontinuitas sesi.
BROWSER_PROFILE_PERSISTx-browser-profile-persistMengaktifkan penyimpanan persisten untuk cookie, penyimpanan lokal, dll.
BROWSER_SESSION_TTLx-browser-session-ttlMenentukan batas waktu sesi maksimum dalam detik. Sesi akan otomatis berakhir setelah durasi tidak aktif ini.

Integrasi dengan Claude Desktop

  1. Buka Claude Desktop
  2. Arahkan ke: SettingsToolsMCP Servers
  3. Klik "Tambahkan MCP Server"
  4. Tempelkan konfigurasi Stdio atau Streamable HTTP di atas
  5. Simpan dan aktifkan server
  6. Claude sekarang dapat mengeluarkan kueri web, mengekstrak konten, dan berinteraksi dengan halaman menggunakan Scrapeless

Integrasi dengan Cursor IDE

  1. Buka Cursor
  2. Tekan Cmd + Shift + P dan cari: Configure MCP Servers
  3. Tambahkan konfigurasi Scrapeless MCP menggunakan format di atas
  4. Simpan file dan mulai ulang Cursor (jika perlu)
  5. Sekarang Anda dapat menanyakan hal-hal seperti ini kepada Cursor:
    1. "Search StackOverflow for a solution to this error"
    2. "Scrape the HTML from this page"
  6. Dan itu akan menggunakan Scrapeless di latar belakang.

Alat MCP yang Didukung

NamaDeskripsi
google_searchMesin pencari informasi universal.
google_trendsDapatkan data pencarian trending dari Google Trends.
browser_createBuat atau gunakan kembali sesi browser cloud menggunakan Scrapeless.
browser_closeMenutup sesi saat ini dengan memutuskan browser cloud.
browser_gotoArahkan browser ke URL yang ditentukan.
browser_go_backMundur satu langkah dalam riwayat browser.
browser_go_forwardMaju satu langkah dalam riwayat browser.
browser_clickKlik elemen tertentu di halaman.
browser_typeKetik teks ke dalam bidang input yang ditentukan.
browser_press_keySimulasikan penekanan tombol.
browser_wait_forTunggu hingga elemen halaman tertentu muncul.
browser_waitJeda eksekusi untuk durasi tetap.
browser_screenshotTangkap tangkapan layar halaman saat ini.
browser_get_htmlDapatkan HTML lengkap dari halaman saat ini.
browser_get_textDapatkan semua teks yang terlihat dari halaman saat ini.
browser_scrollGulir ke bagian bawah halaman.
browser_scroll_toGulir elemen tertentu ke dalam tampilan.
scrape_htmlScrape URL dan kembalikan konten HTML lengkapnya.
scrape_markdownScrape URL dan kembalikan kontennya sebagai Markdown.
scrape_screenshotTangkap tangkapan layar berkualitas tinggi dari halaman web mana pun.

Praktik Terbaik Keamanan

Saat menggunakan Scrapeless MCP Server dengan LLM (seperti ChatGPT, Claude, atau Cursor), sangat penting untuk menangani semua konten web yang di-scrape atau diekstraksi dengan hati-hati. Data web tidak tepercaya secara default, dan penanganan yang tidak tepat dapat mengekspos aplikasi Anda terhadap injeksi prompt atau kerentanan keamanan lainnya.

✅ Praktik yang Direkomendasikan

  • Jangan pernah meneruskan konten mentah yang di-scrape langsung ke prompt LLM. HTML mentah, JavaScript, atau teks buatan pengguna mungkin berisi muatan injeksi tersembunyi.
  • Sanitasi dan validasi semua konten yang diekstraksi. Hapus atau escape tag dan skrip yang berpotensi berbahaya sebelum menggunakan konten dalam logika hilir atau model AI.
  • Utamakan ekstraksi terstruktur daripada teks bebas. Gunakan alat seperti scrape_html, scrape_markdown, atau browser_get_text yang ditargetkan dengan pemilih yang dikenal aman untuk hanya mengekstrak konten yang Anda percayai.
  • Terapkan whitelisting domain atau pemilih saat scraping halaman yang dihasilkan secara dinamis, untuk membatasi aliran data ke sumber yang dikenal dan tepercaya.
  • Catat dan pantau semua permintaan keluar yang dibuat melalui alat browser atau scraping, terutama jika Anda menangani data sensitif, token, atau akses jaringan internal.

🚫 Hindari

  • Menyuntikkan HTML yang di-scrape langsung ke prompt
  • Membiarkan pengguna menentukan URL arbitrer atau pemilih CSS tanpa validasi
  • Menyimpan konten yang di-scrape tanpa filter untuk penggunaan prompt di masa mendatang

Komunitas

Hubungi Kami

Untuk pertanyaan, saran, atau permintaan kolaborasi, jangan ragu untuk menghubungi kami melalui: