apify-ultimate-scraper

作成者: apify

55以上のプラットフォーム(Instagram、TikTok、YouTube、Facebook、Google Mapsなど)に対応し、最適なActorを選択する自動ウェブスクレイパー。8つの主要プラットフォームにわたる55以上の事前設定済みActorをカバーし、ユースケース別の選択ガイダンス(リード生成、インフルエンサー発見、ブランドモニタリング、競合分析、トレンド調査)を提供。3つの出力形式(クイックチャット表示、CSVエクスポート、カスタマイズ可能な結果制限付きJSONエクスポート)をサポート。複雑な処理のためのマルチActorワークフローパターンを含む...

npx skills add https://github.com/apify/agent-skills --skill apify-ultimate-scraper

Universal web scraper

AI-driven data extraction from ~100 Actors across 15+ platforms via the Apify CLI.

Rules for every apify command:

  1. Pass --json for machine-readable output (stable across CLI versions).
  2. Pass --user-agent apify-agent-skills/apify-ultimate-scraper for telemetry attribution.
  3. Redirect stderr with 2>/dev/null (stderr contains progress messages that break JSON parsers).

Prerequisites

  • Apify CLI v1.5.0+ (npm install -g apify-cli)
  • Authenticated session (see below)

Authentication

If a CLI command fails with an auth error, authenticate using one of these methods:

  1. OAuth (interactive): apify login (opens browser)
  2. Environment variable: export APIFY_TOKEN=your_token_here
  3. From .env file: source .env (if the file contains APIFY_TOKEN=...)

Generate token: https://console.apify.com/settings/integrations

Workflow

Step 1: Understand goal and select Actor

Identify the target platform and use case. Read references/actor-index.md to find the right Actor.

If the task involves a multi-step pipeline, also read the matching workflow guide:

Task involves...Read
leads, contacts, emails, B2Breferences/workflows/lead-generation.md
competitor, ads, pricingreferences/workflows/competitive-intel.md
influencer, creatorreferences/workflows/influencer-vetting.md
brand, mentions, sentimentreferences/workflows/brand-monitoring.md
reviews, ratings, reputationreferences/workflows/review-analysis.md
SEO, SERP, crawl, content, RAGreferences/workflows/content-and-seo.md
analytics, engagement, performancereferences/workflows/social-media-analytics.md
trends, keywords, hashtagsreferences/workflows/trend-research.md
jobs, recruiting, candidatesreferences/workflows/job-market-and-recruitment.md
real estate, listings, hotelsreferences/workflows/real-estate-and-hospitality.md
price monitoring, e-commerce, productsreferences/workflows/ecommerce-price-monitoring.md
contact enrichment, email extractionreferences/workflows/contact-enrichment.md
knowledge base, RAG, LLM data feedreferences/workflows/knowledge-base-and-rag.md
company research, due diligencereferences/workflows/company-research.md

If no Actor matches in the index, search dynamically:

apify actors search "KEYWORDS" --user-agent apify-agent-skills/apify-ultimate-scraper --json --limit 10 2>/dev/null

From results: items[].username/items[].name (Actor ID), items[].title, items[].stats.totalUsers30Days, items[].currentPricingInfo.pricingModel.

Step 2: Fetch Actor schema and check gotchas

Fetch the input schema dynamically:

apify actors info "ACTOR_ID" --user-agent apify-agent-skills/apify-ultimate-scraper --input --json 2>/dev/null

Also read references/gotchas.md to check for common pitfalls for the selected Actor.

For Actor documentation: apify actors info "ACTOR_ID" --user-agent apify-agent-skills/apify-ultimate-scraper --readme

Step 3: Configure and run

Skip user preferences for simple lookups (e.g., "Nike's follower count"). Go straight to running with quick answer mode.

For larger tasks, confirm output format (quick answer / CSV / JSON) and result count.

Standard run (blocking):

apify actors call "ACTOR_ID" --input-file input.json --user-agent apify-agent-skills/apify-ultimate-scraper --json 2>/dev/null

Prefer --input-file input.json for large or complex inputs. For tiny inputs, inline JSON is acceptable with shell quoting: --input '{"maxItems":10}'.

From output: .id (run ID), .status, .defaultDatasetId, .stats.durationMillis

Fetch results:

apify datasets get-items DATASET_ID --user-agent apify-agent-skills/apify-ultimate-scraper --format json

For CSV: apify datasets get-items DATASET_ID --user-agent apify-agent-skills/apify-ultimate-scraper --format csv

Quick answer mode: Fetch results as JSON, pick top 5, present formatted in chat.

Save to file: Fetch results, use Write tool to save as YYYY-MM-DD_descriptive-name.csv or .json.

Large/long-running scrapes:

apify actors start "ACTOR_ID" --input-file input.json --user-agent apify-agent-skills/apify-ultimate-scraper --json 2>/dev/null

Poll: apify runs info RUN_ID --user-agent apify-agent-skills/apify-ultimate-scraper --json 2>/dev/null (check .status for SUCCEEDED).

Step 4: Deliver results

Report: result count, file location (if saved), key data fields, and links:

  • Dataset: https://console.apify.com/storage/datasets/DATASET_ID
  • Run: https://console.apify.com/actors/runs/RUN_ID

For multi-step workflows: suggest the next pipeline step from the workflow guide.

Troubleshooting

Common errors and pitfalls are documented in references/gotchas.md. Read it before running PPE (pay-per-event) Actors.

apifyのその他のスキル

bug-triage
apify
apify/apify-mcp-server の未処理バグ課題をトリアージし、分析、応答案の作成、承認取得、投稿を行います。
official
dig
apify
Apify MCPサーバー上での作業の探索、計画、仕様策定のための柔軟なスキル。ソースファイルは編集しないでください — このスキルは理解と計画のみを目的としています。
official
apify-actor-development
apify
サーバーレスクラウドプログラムを作成、デバッグ、デプロイし、Webスクレイピング、自動化、データ処理を実現します。JavaScript、TypeScript、Pythonテンプレートに対応し、HTTPおよびブラウザベースのクローリング用に統合されたCrawlee、Playwright、Cheerioライブラリをサポートします。apify runによる分離ストレージを使用したローカルテスト、入出力のスキーマ検証、apify pushによるApifyプラットフォームへのデプロイを含みます。Apify CLI認証と、AI用の.actor/actor.jsonにおける必須のgeneratedByメタデータが必要です...
official
apify-actorization
apify
既存のプロジェクトをサーバーレスのApifyアクターに変換し、言語固有のSDK統合を提供します。JavaScript/TypeScript(Actor.init() / Actor.exit())、Python(非同期コンテキストマネージャー)、およびCLIラッパーを介した任意の言語をサポート。構造化されたワークフローを提供:apify initでスキャフォールド、SDKラッピングの適用、入出力スキーマの設定、apify runでローカルテスト、その後apify pushでデプロイ。入出力スキーマの検証、Dockerコンテナ化、およびオプションのペイ・パー・イベントを含む。
official
apify-audience-analysis
apify
Facebook、Instagram、YouTube、TikTokからオーディエンスの人口統計、エンゲージメントパターン、行動データを抽出します。4つのプラットフォームすべてにおいて、フォロワーの人口統計、エンゲージメント指標、コメント、プロフィール分析をカバーする18以上の専門アクターをサポート。クイックチャット表示、CSVエクスポート、または下流分析用のJSONエクスポートの3つの出力形式を提供。Apifyトークンとmcpc CLIツールが必要で、動的スキーマフェッチを使用して各アクターの要件に合わせて入力を適応させます。構造化されたものを含みます...
official
apify-brand-reputation-monitoring
apify
Google Maps、Booking.com、TripAdvisor、Facebook、Instagram、YouTube、TikTok全体でブランドの評判を監視します。レビュー、評価、コメント、メンションをカバーする16以上の専用Apify Actorに対応。柔軟な出力形式:結果をチャットに表示、CSVにエクスポート、または下流分析用にJSONとして保存可能。ApifyトークンとNode.js 20.6+が必要。mcpc CLIを使用してActorスキーマと入力パラメータを動的に取得。ワークフローはプラットフォーム選択を通じてユーザーをガイドします。
official
apify-competitor-intelligence
apify
Apify Actorsを活用したマルチプラットフォームの競合分析。Google Maps、Booking.com、Facebook、Instagram、YouTube、TikTokに対応。7つのプラットフォームにわたる25以上の専門Actorsをカバーし、各Actorsは特定の分析タイプ(ビジネスデータ抽出、レビュー比較、広告戦略監視、コンテンツパフォーマンス、オーディエンスインサイト)に最適化されています。Apifyトークン、Node.js 20.6以上、およびActorスキーマを動的に取得して分析を実行するためのmcpc CLIツールが必要です。3つの出力形式(クイックチャット表示...)をサポートしています。
official
apify-content-analytics
apify
Apify Actorsを介したInstagram、Facebook、YouTube、TikTok向けのマルチプラットフォームコンテンツ分析。4つのプラットフォームすべてにおいて、投稿、リール、ストーリー、コメント、ハッシュタグ、フォロワー、広告をカバーする17以上の専門Actorsをサポート。mcpc CLIを使用してActorスキーマを動的に取得し、必要な入力と利用可能な出力フィールドを決定。結果は3つの形式(クイックチャット表示、CSVエクスポート、カスタマイズ可能な結果件数のJSONエクスポート)で出力。.envファイル内のApifyトークンとNode.js 20.6+が必要...
official