apify-ultimate-scraper

tarafından apify

55'ten fazla platform (Instagram, TikTok, YouTube, Facebook, Google Maps ve daha fazlası dahil) için en uygun Actor'ları seçen otomatik web kazıyıcı. 8 büyük platformda 55'ten fazla ön yapılandırılmış Actor'ı kapsar ve kullanım senaryosuna özel seçim rehberliği (potansiyel müşteri bulma, fenomen keşfi, marka izleme, rakip analizi, trend araştırması) sunar. Üç çıktı formatını destekler: hızlı sohbet görüntüleme, CSV dışa aktarma veya özelleştirilebilir sonuç limitleriyle JSON dışa aktarma. Karmaşık iş akışları için çoklu Actor desenlerini içerir...

npx skills add https://github.com/apify/agent-skills --skill apify-ultimate-scraper

Universal web scraper

AI-driven data extraction from ~100 Actors across 15+ platforms via the Apify CLI.

Rules for every apify command:

  1. Pass --json for machine-readable output (stable across CLI versions).
  2. Pass --user-agent apify-agent-skills/apify-ultimate-scraper for telemetry attribution.
  3. Redirect stderr with 2>/dev/null (stderr contains progress messages that break JSON parsers).

Prerequisites

  • Apify CLI v1.5.0+ (npm install -g apify-cli)
  • Authenticated session (see below)

Authentication

If a CLI command fails with an auth error, authenticate using one of these methods:

  1. OAuth (interactive): apify login (opens browser)
  2. Environment variable: export APIFY_TOKEN=your_token_here
  3. From .env file: source .env (if the file contains APIFY_TOKEN=...)

Generate token: https://console.apify.com/settings/integrations

Workflow

Step 1: Understand goal and select Actor

Identify the target platform and use case. Read references/actor-index.md to find the right Actor.

If the task involves a multi-step pipeline, also read the matching workflow guide:

Task involves...Read
leads, contacts, emails, B2Breferences/workflows/lead-generation.md
competitor, ads, pricingreferences/workflows/competitive-intel.md
influencer, creatorreferences/workflows/influencer-vetting.md
brand, mentions, sentimentreferences/workflows/brand-monitoring.md
reviews, ratings, reputationreferences/workflows/review-analysis.md
SEO, SERP, crawl, content, RAGreferences/workflows/content-and-seo.md
analytics, engagement, performancereferences/workflows/social-media-analytics.md
trends, keywords, hashtagsreferences/workflows/trend-research.md
jobs, recruiting, candidatesreferences/workflows/job-market-and-recruitment.md
real estate, listings, hotelsreferences/workflows/real-estate-and-hospitality.md
price monitoring, e-commerce, productsreferences/workflows/ecommerce-price-monitoring.md
contact enrichment, email extractionreferences/workflows/contact-enrichment.md
knowledge base, RAG, LLM data feedreferences/workflows/knowledge-base-and-rag.md
company research, due diligencereferences/workflows/company-research.md

If no Actor matches in the index, search dynamically:

apify actors search "KEYWORDS" --user-agent apify-agent-skills/apify-ultimate-scraper --json --limit 10 2>/dev/null

From results: items[].username/items[].name (Actor ID), items[].title, items[].stats.totalUsers30Days, items[].currentPricingInfo.pricingModel.

Step 2: Fetch Actor schema and check gotchas

Fetch the input schema dynamically:

apify actors info "ACTOR_ID" --user-agent apify-agent-skills/apify-ultimate-scraper --input --json 2>/dev/null

Also read references/gotchas.md to check for common pitfalls for the selected Actor.

For Actor documentation: apify actors info "ACTOR_ID" --user-agent apify-agent-skills/apify-ultimate-scraper --readme

Step 3: Configure and run

Skip user preferences for simple lookups (e.g., "Nike's follower count"). Go straight to running with quick answer mode.

For larger tasks, confirm output format (quick answer / CSV / JSON) and result count.

Standard run (blocking):

apify actors call "ACTOR_ID" --input-file input.json --user-agent apify-agent-skills/apify-ultimate-scraper --json 2>/dev/null

Prefer --input-file input.json for large or complex inputs. For tiny inputs, inline JSON is acceptable with shell quoting: --input '{"maxItems":10}'.

From output: .id (run ID), .status, .defaultDatasetId, .stats.durationMillis

Fetch results:

apify datasets get-items DATASET_ID --user-agent apify-agent-skills/apify-ultimate-scraper --format json

For CSV: apify datasets get-items DATASET_ID --user-agent apify-agent-skills/apify-ultimate-scraper --format csv

Quick answer mode: Fetch results as JSON, pick top 5, present formatted in chat.

Save to file: Fetch results, use Write tool to save as YYYY-MM-DD_descriptive-name.csv or .json.

Large/long-running scrapes:

apify actors start "ACTOR_ID" --input-file input.json --user-agent apify-agent-skills/apify-ultimate-scraper --json 2>/dev/null

Poll: apify runs info RUN_ID --user-agent apify-agent-skills/apify-ultimate-scraper --json 2>/dev/null (check .status for SUCCEEDED).

Step 4: Deliver results

Report: result count, file location (if saved), key data fields, and links:

  • Dataset: https://console.apify.com/storage/datasets/DATASET_ID
  • Run: https://console.apify.com/actors/runs/RUN_ID

For multi-step workflows: suggest the next pipeline step from the workflow guide.

Troubleshooting

Common errors and pitfalls are documented in references/gotchas.md. Read it before running PPE (pay-per-event) Actors.

apify tarafından daha fazla skill

bug-triage
apify
Apify/apify-mcp-server üzerindeki açık hata sorunlarını triyajla. Analiz et, yanıt taslağı hazırla, onay al, yayınla.
official
dig
apify
Apify MCP sunucusunda iş keşfetme, planlama ve özellik belirleme için esnek bir beceri. Kaynak dosyaları DÜZENLEMEYİN — bu beceri yalnızca anlama ve planlama içindir.
official
apify-actor-development
apify
Web kazıma, otomasyon ve veri işleme için sunucusuz bulut programları oluşturun, hata ayıklayın ve dağıtın. HTTP ve tarayıcı tabanlı tarama için entegre Crawlee, Playwright ve Cheerio kütüphaneleriyle JavaScript, TypeScript ve Python şablonlarını destekler. İzole depolama ile apify run aracılığıyla yerel test, girdi/çıktılar için şema doğrulama ve apify push ile Apify platformuna dağıtım içerir. Apify CLI kimlik doğrulaması ve .actor/actor.json dosyasında AI için zorunlu generatedBy meta verisi gerektirir...
official
apify-actorization
apify
Mevcut projeleri, dile özgü SDK entegrasyonu ile sunucusuz Apify Actor'lere dönüştürür. JavaScript/TypeScript (Actor.init() / Actor.exit() ile), Python (async context manager) ve CLI sarmalayıcı aracılığıyla herhangi bir dili destekler. Yapılandırılmış iş akışı sağlar: apify init ile iskelet oluşturma, SDK sarmalama uygulama, giriş/çıkış şemalarını yapılandırma, apify run ile yerel test etme ve apify push ile dağıtma. Giriş ve çıkış şeması doğrulaması, Docker konteynerleştirmesi ve isteğe bağlı olay başına ödeme içerir...
official
apify-audience-analysis
apify
Facebook, Instagram, YouTube ve TikTok'tan hedef kitle demografisi, etkileşim kalıpları ve davranış verilerini çıkarır. Dört platformda da takipçi demografisi, etkileşim metrikleri, yorumlar ve profil analizini kapsayan 18+ özel Aktörü destekler. Hızlı sohbet görüntüleme, CSV dışa aktarma veya downstream analiz için JSON dışa aktarma olmak üzere üç çıktı formatı sunar. Apify token ve mcpc CLI aracı gerektirir; her Aktörün gereksinimlerine göre girdileri uyarlamak için dinamik şema getirme kullanır. Yapılandırılmış...
official
apify-brand-reputation-monitoring
apify
Google Maps, Booking.com, TripAdvisor, Facebook, Instagram, YouTube ve TikTok üzerinde marka itibarını izleyin. Tüm büyük platformlardaki yorumları, puanları, yorumları ve bahisleri kapsayan 16'dan fazla özel Apify Actor'ı destekler. Esnek çıktı formatları: sonuçları sohbette görüntüleyin, CSV'ye aktarın veya ileri analiz için JSON olarak kaydedin. Apify token'ı ve Node.js 20.6+ gerektirir; Actor şemalarını ve giriş parametrelerini dinamik olarak almak için mcpc CLI kullanır. İş akışı, kullanıcılara platform seçimi konusunda rehberlik eder,...
official
apify-competitor-intelligence
apify
Apify Aktörleri aracılığıyla Google Maps, Booking.com, Facebook, Instagram, YouTube ve TikTok için çok platformlu rakip analizi. Her biri belirli analiz türleri için optimize edilmiş yedi platformda 25'ten fazla özel Aktörü kapsar: iş verisi çıkarma, inceleme karşılaştırması, reklam stratejisi izleme, içerik performansı ve kitle içgörüleri. Apify tokeni, Node.js 20.6+ ve Aktör şemalarını getirmek ve analizleri dinamik olarak çalıştırmak için mcpc CLI aracı gerektirir. Üç çıktı formatını destekler: hızlı sohbet görüntüleme,...
official
apify-content-analytics
apify
Instagram, Facebook, YouTube ve TikTok için Apify Actors aracılığıyla çok platformlu içerik analitiği. Dört platformda gönderiler, reels, hikayeler, yorumlar, hashtag’ler, takipçiler ve reklamları kapsayan 17’den fazla özel Actor’ü destekler. Gerekli girdileri ve mevcut çıktı alanlarını belirlemek için mcpc CLI kullanarak Actor şemalarını dinamik olarak getirir. Sonuçları üç formatta sunar: hızlı sohbet görüntüleme, CSV dışa aktarma veya özelleştirilebilir sonuç sayılarıyla JSON dışa aktarma. .env dosyasında Apify token’ı ve Node.js 20.6+ gerektirir...
official