apify-ultimate-scraper

par apify

Grattoir web automatisé sélectionnant les meilleurs Actors pour plus de 55 plateformes, dont Instagram, TikTok, YouTube, Facebook, Google Maps et autres. Couvre plus de 55 Actors préconfigurés sur 8 plateformes majeures avec des conseils de sélection spécifiques aux cas d'usage (génération de leads, découverte d'influenceurs, surveillance de marque, analyse concurrentielle, recherche de tendances). Prend en charge trois formats de sortie : affichage rapide dans le chat, export CSV ou export JSON avec limites de résultats personnalisables. Inclut des schémas de workflow multi-Actors pour des tâches complexes...

npx skills add https://github.com/apify/agent-skills --skill apify-ultimate-scraper

Universal web scraper

AI-driven data extraction from ~100 Actors across 15+ platforms via the Apify CLI.

Rules for every apify command:

  1. Pass --json for machine-readable output (stable across CLI versions).
  2. Pass --user-agent apify-agent-skills/apify-ultimate-scraper for telemetry attribution.
  3. Redirect stderr with 2>/dev/null (stderr contains progress messages that break JSON parsers).

Prerequisites

  • Apify CLI v1.5.0+ (npm install -g apify-cli)
  • Authenticated session (see below)

Authentication

If a CLI command fails with an auth error, authenticate using one of these methods:

  1. OAuth (interactive): apify login (opens browser)
  2. Environment variable: export APIFY_TOKEN=your_token_here
  3. From .env file: source .env (if the file contains APIFY_TOKEN=...)

Generate token: https://console.apify.com/settings/integrations

Workflow

Step 1: Understand goal and select Actor

Identify the target platform and use case. Read references/actor-index.md to find the right Actor.

If the task involves a multi-step pipeline, also read the matching workflow guide:

Task involves...Read
leads, contacts, emails, B2Breferences/workflows/lead-generation.md
competitor, ads, pricingreferences/workflows/competitive-intel.md
influencer, creatorreferences/workflows/influencer-vetting.md
brand, mentions, sentimentreferences/workflows/brand-monitoring.md
reviews, ratings, reputationreferences/workflows/review-analysis.md
SEO, SERP, crawl, content, RAGreferences/workflows/content-and-seo.md
analytics, engagement, performancereferences/workflows/social-media-analytics.md
trends, keywords, hashtagsreferences/workflows/trend-research.md
jobs, recruiting, candidatesreferences/workflows/job-market-and-recruitment.md
real estate, listings, hotelsreferences/workflows/real-estate-and-hospitality.md
price monitoring, e-commerce, productsreferences/workflows/ecommerce-price-monitoring.md
contact enrichment, email extractionreferences/workflows/contact-enrichment.md
knowledge base, RAG, LLM data feedreferences/workflows/knowledge-base-and-rag.md
company research, due diligencereferences/workflows/company-research.md

If no Actor matches in the index, search dynamically:

apify actors search "KEYWORDS" --user-agent apify-agent-skills/apify-ultimate-scraper --json --limit 10 2>/dev/null

From results: items[].username/items[].name (Actor ID), items[].title, items[].stats.totalUsers30Days, items[].currentPricingInfo.pricingModel.

Step 2: Fetch Actor schema and check gotchas

Fetch the input schema dynamically:

apify actors info "ACTOR_ID" --user-agent apify-agent-skills/apify-ultimate-scraper --input --json 2>/dev/null

Also read references/gotchas.md to check for common pitfalls for the selected Actor.

For Actor documentation: apify actors info "ACTOR_ID" --user-agent apify-agent-skills/apify-ultimate-scraper --readme

Step 3: Configure and run

Skip user preferences for simple lookups (e.g., "Nike's follower count"). Go straight to running with quick answer mode.

For larger tasks, confirm output format (quick answer / CSV / JSON) and result count.

Standard run (blocking):

apify actors call "ACTOR_ID" --input-file input.json --user-agent apify-agent-skills/apify-ultimate-scraper --json 2>/dev/null

Prefer --input-file input.json for large or complex inputs. For tiny inputs, inline JSON is acceptable with shell quoting: --input '{"maxItems":10}'.

From output: .id (run ID), .status, .defaultDatasetId, .stats.durationMillis

Fetch results:

apify datasets get-items DATASET_ID --user-agent apify-agent-skills/apify-ultimate-scraper --format json

For CSV: apify datasets get-items DATASET_ID --user-agent apify-agent-skills/apify-ultimate-scraper --format csv

Quick answer mode: Fetch results as JSON, pick top 5, present formatted in chat.

Save to file: Fetch results, use Write tool to save as YYYY-MM-DD_descriptive-name.csv or .json.

Large/long-running scrapes:

apify actors start "ACTOR_ID" --input-file input.json --user-agent apify-agent-skills/apify-ultimate-scraper --json 2>/dev/null

Poll: apify runs info RUN_ID --user-agent apify-agent-skills/apify-ultimate-scraper --json 2>/dev/null (check .status for SUCCEEDED).

Step 4: Deliver results

Report: result count, file location (if saved), key data fields, and links:

  • Dataset: https://console.apify.com/storage/datasets/DATASET_ID
  • Run: https://console.apify.com/actors/runs/RUN_ID

For multi-step workflows: suggest the next pipeline step from the workflow guide.

Troubleshooting

Common errors and pitfalls are documented in references/gotchas.md. Read it before running PPE (pay-per-event) Actors.

Plus de skills de apify

bug-triage
apify
Triage des bogues ouverts sur apify/apify-mcp-server. Analyser, rédiger des réponses, obtenir l'approbation, publier.
official
dig
apify
Compétence flexible pour explorer, planifier et spécifier le travail sur le serveur Apify MCP. Ne PAS modifier les fichiers source — cette compétence est réservée à la compréhension et à la planification uniquement.
official
apify-actor-development
apify
Créez, déboguez et déployez des programmes cloud serverless pour le scraping web, l'automatisation et le traitement de données. Prend en charge les modèles JavaScript, TypeScript et Python avec les bibliothèques intégrées Crawlee, Playwright et Cheerio pour le crawling HTTP et basé sur navigateur. Inclut des tests locaux via apify run avec stockage isolé, validation de schéma pour les entrées/sorties, et déploiement sur la plateforme Apify via apify push. Nécessite l'authentification Apify CLI et les métadonnées obligatoires generatedBy dans .actor/actor.json pour l'IA...
official
apify-actorization
apify
Convertissez des projets existants en Apify Actors serverless avec intégration SDK spécifique au langage. Prend en charge JavaScript/TypeScript (avec Actor.init() / Actor.exit()), Python (gestionnaire de contexte asynchrone) et tout langage via un wrapper CLI. Fournit un flux de travail structuré : apify init pour générer la structure, appliquer le wrapping SDK, configurer les schémas d'entrée/sortie, tester localement avec apify run, puis déployer avec apify push. Inclut la validation des schémas d'entrée et de sortie, la conteneurisation Docker et une option de paiement par événement...
official
apify-audience-analysis
apify
Extraire les données démographiques de l'audience, les schémas d'engagement et les comportements depuis Facebook, Instagram, YouTube et TikTok. Prend en charge plus de 18 Acteurs spécialisés couvrant les données démographiques des abonnés, les métriques d'engagement, les commentaires et l'analyse de profils sur les quatre plateformes. Propose trois formats de sortie : affichage rapide dans le chat, export CSV ou export JSON pour une analyse en aval. Nécessite un jeton Apify et l'outil CLI mcpc ; utilise la récupération dynamique de schéma pour adapter les entrées aux exigences de chaque Acteur. Inclut une structure...
official
apify-brand-reputation-monitoring
apify
Surveillez la réputation de votre marque sur Google Maps, Booking.com, TripAdvisor, Facebook, Instagram, YouTube et TikTok. Prend en charge plus de 16 Apify Actors dédiés couvrant les avis, notes, commentaires et mentions sur toutes les grandes plateformes. Formats de sortie flexibles : affichage des résultats dans le chat, exportation en CSV ou sauvegarde en JSON pour une analyse ultérieure. Nécessite un jeton Apify et Node.js 20.6+ ; utilise l'interface CLI mcpc pour récupérer dynamiquement les schémas et paramètres d'entrée des Actors. Le flux de travail guide l'utilisateur dans la sélection de la plateforme,...
official
apify-competitor-intelligence
apify
Analyse concurrentielle multi-plateforme via les Acteurs Apify pour Google Maps, Booking.com, Facebook, Instagram, YouTube et TikTok. Couvre plus de 25 Acteurs spécialisés sur sept plateformes, chacun optimisé pour des types d'analyse spécifiques : extraction de données commerciales, comparaison d'avis, suivi de stratégie publicitaire, performance de contenu et insights d'audience. Nécessite un jeton Apify, Node.js 20.6+ et l'outil CLI mcpc pour récupérer les schémas d'Acteurs et exécuter des analyses dynamiquement. Prend en charge trois formats de sortie : affichage rapide en chat,...
official
apify-content-analytics
apify
Analytique de contenu multiplateforme via les Acteurs Apify pour Instagram, Facebook, YouTube et TikTok. Prend en charge plus de 17 Acteurs spécialisés couvrant les publications, reels, stories, commentaires, hashtags, abonnés et publicités sur les quatre plateformes. Récupère dynamiquement les schémas des Acteurs à l'aide de l'interface CLI mcpc pour déterminer les entrées requises et les champs de sortie disponibles. Produit les résultats en trois formats : affichage rapide dans le chat, export CSV ou export JSON avec des nombres de résultats personnalisables. Nécessite un jeton Apify dans le fichier .env et Node.js 20.6+...
official