apify-ultimate-scraper

por apify

Raspador web automatizado que selecciona los Actores óptimos para más de 55 plataformas, incluyendo Instagram, TikTok, YouTube, Facebook, Google Maps y más. Cubre más de 55 Actores preconfigurados en 8 plataformas principales con orientación de selección específica para casos de uso (generación de leads, descubrimiento de influencers, monitoreo de marca, análisis de competencia, investigación de tendencias). Admite tres formatos de salida: visualización rápida en chat, exportación CSV o exportación JSON con límites de resultados personalizables. Incluye patrones de flujo de trabajo con múltiples Actores para casos complejos...

npx skills add https://github.com/apify/agent-skills --skill apify-ultimate-scraper

Universal web scraper

AI-driven data extraction from ~100 Actors across 15+ platforms via the Apify CLI.

Rules for every apify command:

  1. Pass --json for machine-readable output (stable across CLI versions).
  2. Pass --user-agent apify-agent-skills/apify-ultimate-scraper for telemetry attribution.
  3. Redirect stderr with 2>/dev/null (stderr contains progress messages that break JSON parsers).

Prerequisites

  • Apify CLI v1.5.0+ (npm install -g apify-cli)
  • Authenticated session (see below)

Authentication

If a CLI command fails with an auth error, authenticate using one of these methods:

  1. OAuth (interactive): apify login (opens browser)
  2. Environment variable: export APIFY_TOKEN=your_token_here
  3. From .env file: source .env (if the file contains APIFY_TOKEN=...)

Generate token: https://console.apify.com/settings/integrations

Workflow

Step 1: Understand goal and select Actor

Identify the target platform and use case. Read references/actor-index.md to find the right Actor.

If the task involves a multi-step pipeline, also read the matching workflow guide:

Task involves...Read
leads, contacts, emails, B2Breferences/workflows/lead-generation.md
competitor, ads, pricingreferences/workflows/competitive-intel.md
influencer, creatorreferences/workflows/influencer-vetting.md
brand, mentions, sentimentreferences/workflows/brand-monitoring.md
reviews, ratings, reputationreferences/workflows/review-analysis.md
SEO, SERP, crawl, content, RAGreferences/workflows/content-and-seo.md
analytics, engagement, performancereferences/workflows/social-media-analytics.md
trends, keywords, hashtagsreferences/workflows/trend-research.md
jobs, recruiting, candidatesreferences/workflows/job-market-and-recruitment.md
real estate, listings, hotelsreferences/workflows/real-estate-and-hospitality.md
price monitoring, e-commerce, productsreferences/workflows/ecommerce-price-monitoring.md
contact enrichment, email extractionreferences/workflows/contact-enrichment.md
knowledge base, RAG, LLM data feedreferences/workflows/knowledge-base-and-rag.md
company research, due diligencereferences/workflows/company-research.md

If no Actor matches in the index, search dynamically:

apify actors search "KEYWORDS" --user-agent apify-agent-skills/apify-ultimate-scraper --json --limit 10 2>/dev/null

From results: items[].username/items[].name (Actor ID), items[].title, items[].stats.totalUsers30Days, items[].currentPricingInfo.pricingModel.

Step 2: Fetch Actor schema and check gotchas

Fetch the input schema dynamically:

apify actors info "ACTOR_ID" --user-agent apify-agent-skills/apify-ultimate-scraper --input --json 2>/dev/null

Also read references/gotchas.md to check for common pitfalls for the selected Actor.

For Actor documentation: apify actors info "ACTOR_ID" --user-agent apify-agent-skills/apify-ultimate-scraper --readme

Step 3: Configure and run

Skip user preferences for simple lookups (e.g., "Nike's follower count"). Go straight to running with quick answer mode.

For larger tasks, confirm output format (quick answer / CSV / JSON) and result count.

Standard run (blocking):

apify actors call "ACTOR_ID" --input-file input.json --user-agent apify-agent-skills/apify-ultimate-scraper --json 2>/dev/null

Prefer --input-file input.json for large or complex inputs. For tiny inputs, inline JSON is acceptable with shell quoting: --input '{"maxItems":10}'.

From output: .id (run ID), .status, .defaultDatasetId, .stats.durationMillis

Fetch results:

apify datasets get-items DATASET_ID --user-agent apify-agent-skills/apify-ultimate-scraper --format json

For CSV: apify datasets get-items DATASET_ID --user-agent apify-agent-skills/apify-ultimate-scraper --format csv

Quick answer mode: Fetch results as JSON, pick top 5, present formatted in chat.

Save to file: Fetch results, use Write tool to save as YYYY-MM-DD_descriptive-name.csv or .json.

Large/long-running scrapes:

apify actors start "ACTOR_ID" --input-file input.json --user-agent apify-agent-skills/apify-ultimate-scraper --json 2>/dev/null

Poll: apify runs info RUN_ID --user-agent apify-agent-skills/apify-ultimate-scraper --json 2>/dev/null (check .status for SUCCEEDED).

Step 4: Deliver results

Report: result count, file location (if saved), key data fields, and links:

  • Dataset: https://console.apify.com/storage/datasets/DATASET_ID
  • Run: https://console.apify.com/actors/runs/RUN_ID

For multi-step workflows: suggest the next pipeline step from the workflow guide.

Troubleshooting

Common errors and pitfalls are documented in references/gotchas.md. Read it before running PPE (pay-per-event) Actors.

Más skills de apify

bug-triage
apify
Triage de issues de errores abiertos en apify/apify-mcp-server. Analizar, redactar respuestas, obtener aprobación, publicar.
official
dig
apify
Habilidad flexible para explorar, planificar y especificar trabajo en el servidor Apify MCP. NO edites archivos fuente: esta habilidad es solo para comprensión y planificación.
official
apify-actor-development
apify
Crear, depurar e implementar programas en la nube sin servidor para web scraping, automatización y procesamiento de datos. Compatible con plantillas de JavaScript, TypeScript y Python con las bibliotecas integradas Crawlee, Playwright y Cheerio para rastreo HTTP y basado en navegador. Incluye pruebas locales mediante apify run con almacenamiento aislado, validación de esquemas para entradas/salidas e implementación en la plataforma Apify mediante apify push. Requiere autenticación de Apify CLI y metadatos obligatorios generatedBy en .actor/actor.json para IA...
official
apify-actorization
apify
Convierte proyectos existentes en Apify Actors sin servidor con integración de SDK específica para cada lenguaje. Soporta JavaScript/TypeScript (con Actor.init() / Actor.exit()), Python (gestor de contexto asíncrono) y cualquier lenguaje mediante envoltorio CLI. Proporciona un flujo de trabajo estructurado: apify init para crear la estructura, aplicar envoltorio SDK, configurar esquemas de entrada/salida, probar localmente con apify run y luego desplegar con apify push. Incluye validación de esquemas de entrada y salida, contenedorización Docker y opcional pago por evento...
official
apify-audience-analysis
apify
Extrae datos demográficos de la audiencia, patrones de participación y comportamiento de Facebook, Instagram, YouTube y TikTok. Compatible con más de 18 actores especializados que cubren datos demográficos de seguidores, métricas de participación, comentarios y análisis de perfiles en las cuatro plataformas. Ofrece tres formatos de salida: visualización rápida en chat, exportación CSV o exportación JSON para análisis posteriores. Requiere token de Apify y la herramienta CLI mcpc; utiliza obtención dinámica de esquemas para adaptar las entradas a los requisitos de cada actor. Incluye estructura...
official
apify-brand-reputation-monitoring
apify
Monitoree la reputación de la marca en Google Maps, Booking.com, TripAdvisor, Facebook, Instagram, YouTube y TikTok. Compatible con más de 16 actores dedicados de Apify que cubren reseñas, calificaciones, comentarios y menciones en todas las plataformas principales. Formatos de salida flexibles: muestre resultados en el chat, exporte a CSV o guarde como JSON para análisis posteriores. Requiere token de Apify y Node.js 20.6+; utiliza la CLI de mcpc para obtener dinámicamente esquemas de actores y parámetros de entrada. El flujo de trabajo guía al usuario a través de la selección de plataforma,...
official
apify-competitor-intelligence
apify
Análisis de competidores multiplataforma mediante Apify Actors para Google Maps, Booking.com, Facebook, Instagram, YouTube y TikTok. Cubre más de 25 Actors especializados en siete plataformas, cada uno optimizado para tipos específicos de análisis: extracción de datos comerciales, comparación de reseñas, monitoreo de estrategias publicitarias, rendimiento de contenido e información de audiencia. Requiere token de Apify, Node.js 20.6+ y la herramienta CLI mcpc para obtener esquemas de Actors y ejecutar análisis de forma dinámica. Admite tres formatos de salida: visualización rápida en chat,...
official
apify-content-analytics
apify
Análisis de contenido multiplataforma a través de Apify Actors para Instagram, Facebook, YouTube y TikTok. Soporta más de 17 Actors especializados que cubren publicaciones, reels, historias, comentarios, hashtags, seguidores y anuncios en las cuatro plataformas. Obtiene dinámicamente los esquemas de los Actors usando mcpc CLI para determinar las entradas requeridas y los campos de salida disponibles. Presenta los resultados en tres formatos: visualización rápida en chat, exportación CSV o exportación JSON con recuentos de resultados personalizables. Requiere token de Apify en el archivo .env y Node.js 20.6+...
official