apify-ultimate-scraper

por apify

Raspador web automatizado que seleciona os melhores Atores para mais de 55 plataformas, incluindo Instagram, TikTok, YouTube, Facebook, Google Maps e outras. Abrange mais de 55 Atores pré-configurados em 8 plataformas principais, com orientação de seleção específica para cada caso de uso (geração de leads, descoberta de influenciadores, monitoramento de marca, análise de concorrentes, pesquisa de tendências). Suporta três formatos de saída: exibição rápida no chat, exportação CSV ou exportação JSON com limites de resultados personalizáveis. Inclui padrões de fluxo de trabalho com múltiplos Atores para cenários complexos...

npx skills add https://github.com/apify/agent-skills --skill apify-ultimate-scraper

Universal web scraper

AI-driven data extraction from ~100 Actors across 15+ platforms via the Apify CLI.

Rules for every apify command:

  1. Pass --json for machine-readable output (stable across CLI versions).
  2. Pass --user-agent apify-agent-skills/apify-ultimate-scraper for telemetry attribution.
  3. Redirect stderr with 2>/dev/null (stderr contains progress messages that break JSON parsers).

Prerequisites

  • Apify CLI v1.5.0+ (npm install -g apify-cli)
  • Authenticated session (see below)

Authentication

If a CLI command fails with an auth error, authenticate using one of these methods:

  1. OAuth (interactive): apify login (opens browser)
  2. Environment variable: export APIFY_TOKEN=your_token_here
  3. From .env file: source .env (if the file contains APIFY_TOKEN=...)

Generate token: https://console.apify.com/settings/integrations

Workflow

Step 1: Understand goal and select Actor

Identify the target platform and use case. Read references/actor-index.md to find the right Actor.

If the task involves a multi-step pipeline, also read the matching workflow guide:

Task involves...Read
leads, contacts, emails, B2Breferences/workflows/lead-generation.md
competitor, ads, pricingreferences/workflows/competitive-intel.md
influencer, creatorreferences/workflows/influencer-vetting.md
brand, mentions, sentimentreferences/workflows/brand-monitoring.md
reviews, ratings, reputationreferences/workflows/review-analysis.md
SEO, SERP, crawl, content, RAGreferences/workflows/content-and-seo.md
analytics, engagement, performancereferences/workflows/social-media-analytics.md
trends, keywords, hashtagsreferences/workflows/trend-research.md
jobs, recruiting, candidatesreferences/workflows/job-market-and-recruitment.md
real estate, listings, hotelsreferences/workflows/real-estate-and-hospitality.md
price monitoring, e-commerce, productsreferences/workflows/ecommerce-price-monitoring.md
contact enrichment, email extractionreferences/workflows/contact-enrichment.md
knowledge base, RAG, LLM data feedreferences/workflows/knowledge-base-and-rag.md
company research, due diligencereferences/workflows/company-research.md

If no Actor matches in the index, search dynamically:

apify actors search "KEYWORDS" --user-agent apify-agent-skills/apify-ultimate-scraper --json --limit 10 2>/dev/null

From results: items[].username/items[].name (Actor ID), items[].title, items[].stats.totalUsers30Days, items[].currentPricingInfo.pricingModel.

Step 2: Fetch Actor schema and check gotchas

Fetch the input schema dynamically:

apify actors info "ACTOR_ID" --user-agent apify-agent-skills/apify-ultimate-scraper --input --json 2>/dev/null

Also read references/gotchas.md to check for common pitfalls for the selected Actor.

For Actor documentation: apify actors info "ACTOR_ID" --user-agent apify-agent-skills/apify-ultimate-scraper --readme

Step 3: Configure and run

Skip user preferences for simple lookups (e.g., "Nike's follower count"). Go straight to running with quick answer mode.

For larger tasks, confirm output format (quick answer / CSV / JSON) and result count.

Standard run (blocking):

apify actors call "ACTOR_ID" --input-file input.json --user-agent apify-agent-skills/apify-ultimate-scraper --json 2>/dev/null

Prefer --input-file input.json for large or complex inputs. For tiny inputs, inline JSON is acceptable with shell quoting: --input '{"maxItems":10}'.

From output: .id (run ID), .status, .defaultDatasetId, .stats.durationMillis

Fetch results:

apify datasets get-items DATASET_ID --user-agent apify-agent-skills/apify-ultimate-scraper --format json

For CSV: apify datasets get-items DATASET_ID --user-agent apify-agent-skills/apify-ultimate-scraper --format csv

Quick answer mode: Fetch results as JSON, pick top 5, present formatted in chat.

Save to file: Fetch results, use Write tool to save as YYYY-MM-DD_descriptive-name.csv or .json.

Large/long-running scrapes:

apify actors start "ACTOR_ID" --input-file input.json --user-agent apify-agent-skills/apify-ultimate-scraper --json 2>/dev/null

Poll: apify runs info RUN_ID --user-agent apify-agent-skills/apify-ultimate-scraper --json 2>/dev/null (check .status for SUCCEEDED).

Step 4: Deliver results

Report: result count, file location (if saved), key data fields, and links:

  • Dataset: https://console.apify.com/storage/datasets/DATASET_ID
  • Run: https://console.apify.com/actors/runs/RUN_ID

For multi-step workflows: suggest the next pipeline step from the workflow guide.

Troubleshooting

Common errors and pitfalls are documented in references/gotchas.md. Read it before running PPE (pay-per-event) Actors.

Mais skills de apify

bug-triage
apify
Trie os bugs abertos no apify/apify-mcp-server. Analise, rascunhe respostas, obtenha aprovação, publique.
official
dig
apify
Habilidade flexível para explorar, planejar e especificar trabalhos no servidor Apify MCP. NÃO edite arquivos de origem — esta habilidade é apenas para entendimento e planejamento.
official
apify-actor-development
apify
Crie, depure e implante programas serverless em nuvem para web scraping, automação e processamento de dados. Suporta templates em JavaScript, TypeScript e Python com as bibliotecas integradas Crawlee, Playwright e Cheerio para crawling baseado em HTTP e navegador. Inclui testes locais via apify run com armazenamento isolado, validação de esquema para entradas/saídas e implantação na plataforma Apify via apify push. Requer autenticação da CLI Apify e metadados obrigatórios generatedBy em .actor/actor.json para IA...
official
apify-actorization
apify
Converta projetos existentes em Apify Actors serverless com integração de SDK específica para cada linguagem. Suporta JavaScript/TypeScript (com Actor.init() / Actor.exit()), Python (gerenciador de contexto assíncrono) e qualquer linguagem via wrapper CLI. Fornece fluxo de trabalho estruturado: apify init para estruturar, aplicar encapsulamento do SDK, configurar esquemas de entrada/saída, testar localmente com apify run e depois implantar com apify push. Inclui validação de esquemas de entrada e saída, conteinerização Docker e opcional pay-per-event...
official
apify-audience-analysis
apify
Extraia dados demográficos do público, padrões de engajamento e comportamento do Facebook, Instagram, YouTube e TikTok. Suporta mais de 18 Atores especializados que abrangem dados demográficos de seguidores, métricas de engajamento, comentários e análise de perfil em todas as quatro plataformas. Oferece três formatos de saída: exibição rápida no chat, exportação CSV ou exportação JSON para análise posterior. Requer token Apify e ferramenta CLI mcpc; usa busca dinâmica de esquemas para adaptar entradas aos requisitos de cada Ator. Inclui estruturado...
official
apify-brand-reputation-monitoring
apify
Monitore a reputação da marca no Google Maps, Booking.com, TripAdvisor, Facebook, Instagram, YouTube e TikTok. Suporta mais de 16 Apify Actors dedicados que cobrem avaliações, classificações, comentários e menções em todas as principais plataformas. Formatos de saída flexíveis: exiba resultados no chat, exporte para CSV ou salve como JSON para análises posteriores. Requer token Apify e Node.js 20.6+; usa a CLI mcpc para buscar dinamicamente esquemas de Actors e parâmetros de entrada. O fluxo de trabalho orienta o usuário na seleção de plataforma,...
official
apify-competitor-intelligence
apify
Análise de concorrentes multiplataforma via Apify Actors para Google Maps, Booking.com, Facebook, Instagram, YouTube e TikTok. Abrange mais de 25 Actors especializados em sete plataformas, cada um otimizado para tipos específicos de análise: extração de dados comerciais, comparação de avaliações, monitoramento de estratégia de anúncios, desempenho de conteúdo e insights de público. Requer token Apify, Node.js 20.6+ e a ferramenta CLI mcpc para buscar esquemas de Actors e executar análises dinamicamente. Suporta três formatos de saída: exibição rápida em chat,...
official
apify-content-analytics
apify
Análise de conteúdo multiplataforma via Apify Actors para Instagram, Facebook, YouTube e TikTok. Suporta mais de 17 Actors especializados cobrindo posts, reels, stories, comentários, hashtags, seguidores e anúncios em todas as quatro plataformas. Busca dinamicamente os esquemas dos Actors usando a CLI mcpc para determinar as entradas necessárias e os campos de saída disponíveis. Gera resultados em três formatos: exibição rápida no chat, exportação CSV ou exportação JSON com contagens de resultados personalizáveis. Requer token Apify no arquivo .env e Node.js 20.6+...
official