apify-ultimate-scraper

oleh apify

Pengikis web otomatis yang memilih Aktor optimal untuk 55+ platform termasuk Instagram, TikTok, YouTube, Facebook, Google Maps, dan lainnya. Mencakup 55+ Aktor yang telah dikonfigurasi sebelumnya di 8 platform utama dengan panduan pemilihan berdasarkan kasus penggunaan (generasi prospek, penemuan influencer, pemantauan merek, analisis pesaing, riset tren). Mendukung tiga format keluaran: tampilan obrolan cepat, ekspor CSV, atau ekspor JSON dengan batas hasil yang dapat disesuaikan. Termasuk pola alur kerja multi-Aktor untuk kompleks...

npx skills add https://github.com/apify/agent-skills --skill apify-ultimate-scraper

Universal web scraper

AI-driven data extraction from ~100 Actors across 15+ platforms via the Apify CLI.

Rules for every apify command:

  1. Pass --json for machine-readable output (stable across CLI versions).
  2. Pass --user-agent apify-agent-skills/apify-ultimate-scraper for telemetry attribution.
  3. Redirect stderr with 2>/dev/null (stderr contains progress messages that break JSON parsers).

Prerequisites

  • Apify CLI v1.5.0+ (npm install -g apify-cli)
  • Authenticated session (see below)

Authentication

If a CLI command fails with an auth error, authenticate using one of these methods:

  1. OAuth (interactive): apify login (opens browser)
  2. Environment variable: export APIFY_TOKEN=your_token_here
  3. From .env file: source .env (if the file contains APIFY_TOKEN=...)

Generate token: https://console.apify.com/settings/integrations

Workflow

Step 1: Understand goal and select Actor

Identify the target platform and use case. Read references/actor-index.md to find the right Actor.

If the task involves a multi-step pipeline, also read the matching workflow guide:

Task involves...Read
leads, contacts, emails, B2Breferences/workflows/lead-generation.md
competitor, ads, pricingreferences/workflows/competitive-intel.md
influencer, creatorreferences/workflows/influencer-vetting.md
brand, mentions, sentimentreferences/workflows/brand-monitoring.md
reviews, ratings, reputationreferences/workflows/review-analysis.md
SEO, SERP, crawl, content, RAGreferences/workflows/content-and-seo.md
analytics, engagement, performancereferences/workflows/social-media-analytics.md
trends, keywords, hashtagsreferences/workflows/trend-research.md
jobs, recruiting, candidatesreferences/workflows/job-market-and-recruitment.md
real estate, listings, hotelsreferences/workflows/real-estate-and-hospitality.md
price monitoring, e-commerce, productsreferences/workflows/ecommerce-price-monitoring.md
contact enrichment, email extractionreferences/workflows/contact-enrichment.md
knowledge base, RAG, LLM data feedreferences/workflows/knowledge-base-and-rag.md
company research, due diligencereferences/workflows/company-research.md

If no Actor matches in the index, search dynamically:

apify actors search "KEYWORDS" --user-agent apify-agent-skills/apify-ultimate-scraper --json --limit 10 2>/dev/null

From results: items[].username/items[].name (Actor ID), items[].title, items[].stats.totalUsers30Days, items[].currentPricingInfo.pricingModel.

Step 2: Fetch Actor schema and check gotchas

Fetch the input schema dynamically:

apify actors info "ACTOR_ID" --user-agent apify-agent-skills/apify-ultimate-scraper --input --json 2>/dev/null

Also read references/gotchas.md to check for common pitfalls for the selected Actor.

For Actor documentation: apify actors info "ACTOR_ID" --user-agent apify-agent-skills/apify-ultimate-scraper --readme

Step 3: Configure and run

Skip user preferences for simple lookups (e.g., "Nike's follower count"). Go straight to running with quick answer mode.

For larger tasks, confirm output format (quick answer / CSV / JSON) and result count.

Standard run (blocking):

apify actors call "ACTOR_ID" --input-file input.json --user-agent apify-agent-skills/apify-ultimate-scraper --json 2>/dev/null

Prefer --input-file input.json for large or complex inputs. For tiny inputs, inline JSON is acceptable with shell quoting: --input '{"maxItems":10}'.

From output: .id (run ID), .status, .defaultDatasetId, .stats.durationMillis

Fetch results:

apify datasets get-items DATASET_ID --user-agent apify-agent-skills/apify-ultimate-scraper --format json

For CSV: apify datasets get-items DATASET_ID --user-agent apify-agent-skills/apify-ultimate-scraper --format csv

Quick answer mode: Fetch results as JSON, pick top 5, present formatted in chat.

Save to file: Fetch results, use Write tool to save as YYYY-MM-DD_descriptive-name.csv or .json.

Large/long-running scrapes:

apify actors start "ACTOR_ID" --input-file input.json --user-agent apify-agent-skills/apify-ultimate-scraper --json 2>/dev/null

Poll: apify runs info RUN_ID --user-agent apify-agent-skills/apify-ultimate-scraper --json 2>/dev/null (check .status for SUCCEEDED).

Step 4: Deliver results

Report: result count, file location (if saved), key data fields, and links:

  • Dataset: https://console.apify.com/storage/datasets/DATASET_ID
  • Run: https://console.apify.com/actors/runs/RUN_ID

For multi-step workflows: suggest the next pipeline step from the workflow guide.

Troubleshooting

Common errors and pitfalls are documented in references/gotchas.md. Read it before running PPE (pay-per-event) Actors.

Lebih banyak skill dari apify

bug-triage
apify
Lakukan triage pada isu bug terbuka di apify/apify-mcp-server. Analisis, buat draf tanggapan, dapatkan persetujuan, lalu posting.
official
dig
apify
Keahlian fleksibel untuk menjelajahi, merencanakan, dan menspesifikasikan pekerjaan di server Apify MCP. JANGAN edit file sumber — keahlian ini hanya untuk pemahaman dan perencanaan.
official
apify-actor-development
apify
Buat, debug, dan sebarkan program cloud tanpa server untuk web scraping, otomatisasi, dan pemrosesan data. Mendukung template JavaScript, TypeScript, dan Python dengan pustaka Crawlee, Playwright, dan Cheerio terintegrasi untuk crawling berbasis HTTP dan browser. Termasuk pengujian lokal melalui apify run dengan penyimpanan terisolasi, validasi skema untuk input/output, dan penyebaran ke platform Apify melalui apify push. Memerlukan autentikasi CLI Apify dan metadata generatedBy wajib di .actor/actor.json untuk AI...
official
apify-actorization
apify
Ubah proyek yang sudah ada menjadi Apify Actor tanpa server dengan integrasi SDK spesifik bahasa. Mendukung JavaScript/TypeScript (dengan Actor.init() / Actor.exit()), Python (async context manager), dan bahasa lain melalui wrapper CLI. Menyediakan alur kerja terstruktur: apify init untuk membuat kerangka, menerapkan pembungkusan SDK, mengonfigurasi skema input/output, uji secara lokal dengan apify run, lalu terapkan dengan apify push. Termasuk validasi skema input dan output, kontainerisasi Docker, dan opsional bayar-per-peristiwa...
official
apify-audience-analysis
apify
Ekstrak demografi audiens, pola keterlibatan, dan data perilaku dari Facebook, Instagram, YouTube, dan TikTok. Mendukung 18+ Aktor khusus yang mencakup demografi pengikut, metrik keterlibatan, komentar, dan analisis profil di keempat platform. Menyediakan tiga format output: tampilan obrolan cepat, ekspor CSV, atau ekspor JSON untuk analisis lanjutan. Membutuhkan token Apify dan alat CLI mcpc; menggunakan pengambilan skema dinamis untuk menyesuaikan input dengan kebutuhan setiap Aktor. Termasuk struktur...
official
apify-brand-reputation-monitoring
apify
Pantau reputasi merek di Google Maps, Booking.com, TripAdvisor, Facebook, Instagram, YouTube, dan TikTok. Mendukung 16+ Apify Actors khusus yang mencakup ulasan, peringkat, komentar, dan penyebutan di semua platform utama. Format output fleksibel: tampilkan hasil di chat, ekspor ke CSV, atau simpan sebagai JSON untuk analisis lanjutan. Membutuhkan token Apify dan Node.js 20.6+; menggunakan CLI mcpc untuk mengambil skema Actor dan parameter input secara dinamis. Alur kerja memandu pengguna melalui pemilihan platform,...
official
apify-competitor-intelligence
apify
Analisis pesaing multi-platform melalui Apify Actors untuk Google Maps, Booking.com, Facebook, Instagram, YouTube, dan TikTok. Mencakup lebih dari 25 Actor khusus di tujuh platform, masing-masing dioptimalkan untuk jenis analisis spesifik: ekstraksi data bisnis, perbandingan ulasan, pemantauan strategi iklan, performa konten, dan wawasan audiens. Membutuhkan token Apify, Node.js 20.6+, dan alat CLI mcpc untuk mengambil skema Actor dan menjalankan analisis secara dinamis. Mendukung tiga format keluaran: tampilan obrolan cepat,...
official
apify-content-analytics
apify
Analitik konten multi-platform melalui Apify Actors untuk Instagram, Facebook, YouTube, dan TikTok. Mendukung 17+ Actor khusus yang mencakup postingan, reel, cerita, komentar, tagar, pengikut, dan iklan di keempat platform. Mengambil skema Actor secara dinamis menggunakan mcpc CLI untuk menentukan input yang diperlukan dan bidang output yang tersedia. Menghasilkan hasil dalam tiga format: tampilan obrolan cepat, ekspor CSV, atau ekspor JSON dengan jumlah hasil yang dapat disesuaikan. Memerlukan token Apify di file .env dan Node.js 20.6+...
official