Scrapeless MCP Server

resmi

Gerçek zamanlı Scrapeless Google SERP (Google Arama, Google Uçuş, Google Harita, Google İşler...) sonuçlarını LLM uygulamalarınıza entegre edin. Bu sunucu, AI iş akışları, sohbet robotları ve araştırma araçları için dinamik bağlam alımını sağlar.

Dokümantasyon

preview

Scrapeless MCP Sunucusu

Resmi Scrapeless Model Bağlam Protokolü (MCP) Sunucusuna hoş geldiniz — Yapay zeka modellerinin, yapay zeka ajanlarının ve yapay zeka uygulamalarının web ile gerçek zamanlı etkileşim kurmasını sağlayan güçlü bir entegrasyon katmanı.

Açık MCP standardı üzerine inşa edilen Scrapeless MCP Sunucusu, ChatGPT, Claude gibi modelleri ve Cursor, Windsurf gibi araçları aşağıdakiler de dahil olmak üzere çok çeşitli harici yeteneklere sorunsuz bir şekilde bağlar:

  • Google hizmetleri entegrasyonu (Arama, Trendler)
  • Sayfa düzeyinde gezinme ve etkileşim için tarayıcı otomasyonu
  • Dinamik, JS ağırlıklı siteleri kazıma—HTML, Markdown veya ekran görüntüsü olarak dışa aktarma

İster bir yapay zeka araştırma asistanı, ister bir kodlama yardımcı pilotu veya otonom web ajanları geliştiriyor olun, bu sunucu iş akışlarınızın ihtiyaç duyduğu dinamik bağlamı ve gerçek dünya verilerini engellenmeden sağlar.

Kullanım Örnekleri

  1. Claude ile Otomatik Web Etkileşimi ve Veri Çıkarma

Scrapeless MCP Tarayıcı'yı kullanarak Claude, web'de gezinme, tıklama, kaydırma ve kazıma gibi karmaşık görevleri konuşma komutlarıyla gerçekleştirebilir ve web etkileşim sonuçlarının gerçek zamanlı önizlemesini live sessions aracılığıyla görebilir.

preview

  1. Hedef Sayfa İçeriğini Almak için Cloudflare'ı Atlama

Scrapeless MCP Tarayıcı hizmeti kullanılarak Cloudflare sayfasına otomatik olarak erişilir ve işlem tamamlandıktan sonra sayfa içeriği çıkarılır ve Markdown formatında döndürülür.

preview

  1. Dinamik Olarak Oluşturulan Sayfa İçeriğini Çıkarma ve Dosyaya Yazma

Scrapeless MCP Evrensel API'si kullanılarak yukarıdaki hedef sayfanın JavaScript ile oluşturulan içeriği kazınır, Markdown formatında dışa aktarılır ve son olarak text.md adlı yerel bir dosyaya yazılır.

preview

  1. Otomatik SERP Kazıma

Scrapeless MCP Sunucusu kullanılarak Google Arama'da "web scraping" anahtar kelimesi sorgulanır, ilk 10 arama sonucu (başlık, bağlantı ve özet dahil) alınır ve içerik serp.text adlı dosyaya yazılır.

preview

Bu sunucuların nasıl kullanılacağına dair bazı ek örnekler aşağıda verilmiştir:

Örnek
Google araması ile scrapeless'ı ara.
Geçen yıl boyunca "AI" için arama ilgisini bul.
chatgpt.com adresini ziyaret etmek, "Bugün hava nasıl?" diye sormak ve sonuçları özetlemek için bir tarayıcı kullan.
scrapeless.com sayfasının HTML içeriğini kazı.
scrapeless.com sayfasının Markdown içeriğini kazı.
scrapeless.com ekran görüntülerini al.

Kurulum Kılavuzu

  1. Scrapeless Anahtarı Edinin
  • Scrapeless Kontrol Paneline giriş yapın (Ücretsiz deneme mevcuttur)
  • Ardından soldan "Ayarlar"a tıklayın -> "API Anahtar Yönetimi"ni seçin -> "API Anahtarı Oluştur"a tıklayın. Son olarak, oluşturduğunuz API Anahtarına tıklayarak kopyalayın.

preview

  1. MCP İstemcinizi Yapılandırın

Scrapeless MCP Sunucusu hem Stdio hem de Akışlı HTTP aktarım modlarını destekler.

🖥️ Stdio (Yerel Yürütme)

{
  "mcpServers": {
    "Scrapeless MCP Server": {
      "command": "npx",
      "args": ["-y", "scrapeless-mcp-server"],
      "env": {
        "SCRAPELESS_KEY": "YOUR_SCRAPELESS_KEY"
      }
    }
  }
}

🌐 Akışlı HTTP (Barındırılan API Modu)

{
  "mcpServers": {
    "Scrapeless MCP Server": {
      "type": "streamable-http",
      "url": "https://api.scrapeless.com/mcp",
      "headers": {
        "x-api-token": "YOUR_SCRAPELESS_KEY"
      },
      "disabled": false,
      "alwaysAllow": []
    }
  }
}

Gelişmiş Seçenekler

İsteğe bağlı parametrelerle tarayıcı oturum davranışını özelleştirin. Bunlar ortam değişkenleri (Stdio için) veya HTTP başlıkları (Akışlı HTTP için) aracılığıyla ayarlanabilir:

Stdio (Ortam Değişkeni)Akışlı HTTP (HTTP Başlığı)Açıklama
BROWSER_PROFILE_IDx-browser-profile-idOturum sürekliliği için yeniden kullanılabilir bir tarayıcı profili kimliği belirtir.
BROWSER_PROFILE_PERSISTx-browser-profile-persistÇerezler, yerel depolama vb. için kalıcı depolamayı etkinleştirir.
BROWSER_SESSION_TTLx-browser-session-ttlSaniye cinsinden maksimum oturum zaman aşımını tanımlar. Oturum, bu hareketsizlik süresinden sonra otomatik olarak sona erer.

Claude Desktop ile Entegrasyon

  1. Claude Desktop'ı açın
  2. Şuraya gidin: SettingsToolsMCP Servers
  3. **"MCP Sunucusu Ekle"**ye tıklayın
  4. Yukarıdaki Stdio veya Streamable HTTP yapılandırmasını yapıştırın
  5. Kaydedin ve sunucuyu etkinleştirin
  6. Claude artık Scrapeless kullanarak web sorguları yapabilecek, içerik çıkarabilecek ve sayfalarla etkileşim kurabilecek

Cursor IDE ile Entegrasyon

  1. Cursor'ı açın
  2. Cmd + Shift + P tuşlarına basın ve şunu arayın: Configure MCP Servers
  3. Yukarıdaki formatı kullanarak Scrapeless MCP yapılandırmasını ekleyin
  4. Dosyayı kaydedin ve Cursor'ı yeniden başlatın (gerekirse)
  5. Artık Cursor'a şunun gibi şeyler sorabilirsiniz:
    1. "Search StackOverflow for a solution to this error"
    2. "Scrape the HTML from this page"
  6. Ve arka planda Scrapeless'ı kullanacaktır.

Desteklenen MCP Araçları

AdAçıklama
google_searchEvrensel bilgi arama motoru.
google_trendsGoogle Trends'ten trend olan arama verilerini alın.
browser_createScrapeless kullanarak bir bulut tarayıcı oturumu oluşturun veya yeniden kullanın.
browser_closeBulut tarayıcının bağlantısını keserek mevcut oturumu kapatır.
browser_gotoTarayıcıyı belirtilen bir URL'ye yönlendirin.
browser_go_backTarayıcı geçmişinde bir adım geri gidin.
browser_go_forwardTarayıcı geçmişinde bir adım ileri gidin.
browser_clickSayfadaki belirli bir öğeye tıklayın.
browser_typeBelirtilen bir giriş alanına metin yazın.
browser_press_keyBir tuşa basmayı simüle edin.
browser_wait_forBelirli bir sayfa öğesinin görünmesini bekleyin.
browser_waitYürütmeyi sabit bir süre duraklatın.
browser_screenshotMevcut sayfanın ekran görüntüsünü yakalayın.
browser_get_htmlMevcut sayfanın tam HTML'ini alın.
browser_get_textMevcut sayfadaki tüm görünür metni alın.
browser_scrollSayfanın en altına kaydırın.
browser_scroll_toBelirli bir öğeyi görünüme kaydırın.
scrape_htmlBir URL'yi kazıyın ve tam HTML içeriğini döndürün.
scrape_markdownBir URL'yi kazıyın ve içeriğini Markdown olarak döndürün.
scrape_screenshotHerhangi bir web sayfasının yüksek kaliteli ekran görüntüsünü yakalayın.

Güvenlik En İyi Uygulamaları

Scrapeless MCP Sunucusunu YZ modelleriyle (ChatGPT, Claude veya Cursor gibi) kullanırken, kazınan veya çıkarılan tüm web içeriğini dikkatle ele almak kritik önem taşır. Web verileri varsayılan olarak güvenilmezdir ve uygunsuz kullanım, uygulamanızı istem enjeksiyonuna veya diğer güvenlik açıklarına maruz bırakabilir.

✅ Önerilen Uygulamalar

  • Ham kazınmış içeriği asla doğrudan YZ istemlerine aktarmayın. Ham HTML, JavaScript veya kullanıcı tarafından oluşturulan metin, gizli enjeksiyon yükleri içerebilir.
  • Çıkarılan tüm içeriği sterilize edin ve doğrulayın. İçeriği sonraki mantıkta veya yapay zeka modellerinde kullanmadan önce potansiyel olarak zararlı etiketleri ve betikleri temizleyin veya kaçış karakterleri ekleyin.
  • Serbest biçimli metin yerine yapılandırılmış çıkarmayı tercih edin. Yalnızca güvendiğiniz içeriği çıkarmak için bilinen güvenli seçicilerle scrape_html, scrape_markdown veya hedeflenmiş browser_get_text gibi araçları kullanın.
  • Dinamik olarak oluşturulan sayfaları kazırken, veri akışını bilinen ve güvenilen kaynaklarla kısıtlamak için alan adı veya seçici beyaz listesi uygulayın.
  • Özellikle hassas veriler, belirteçler veya dahili ağ erişimiyle uğraşıyorsanız, tarayıcı veya kazıma araçları aracılığıyla yapılan tüm giden istekleri günlüğe kaydedin ve izleyin.

🚫 Kaçının

  • Kazınmış HTML'i doğrudan istemlere enjekte etmek
  • Kullanıcıların doğrulama olmadan rastgele URL'ler veya CSS seçicileri belirtmesine izin vermek
  • Gelecekteki istem kullanımı için filtrelenmemiş kazınmış içeriği depolamak

Topluluk

Bize Ulaşın

Sorularınız, önerileriniz veya iş birliği talepleriniz için bizimle şu yollarla iletişime geçmekten çekinmeyin: