firecrawl-crawl

作成者: firecrawl

ウェブサイト全体やサイトセクションから、深さとパスフィルタリングを用いてコンテンツを一括抽出します。設定可能な深さ制限とページ数に従ってリンクを辿りながらページをクロールし、パスの包含/除外フィルタで抽出範囲を絞り込みます。--wait フラグと --progress フラグを使用した非同期ジョブのポーリングや、進捗表示付きの同期待機をサポートします。エージェントワークフローへの統合のために、同時実行制御、リクエスト遅延、JSON出力フォーマットを提供します。4段階のエスカレーションパターン(検索→スクレイピング→...)の一部です。

npx skills add https://github.com/firecrawl/cli --skill firecrawl-crawl

firecrawl crawl

Bulk extract content from a website. Crawls pages following links up to a depth/limit.

When to use

  • You need content from many pages on a site (e.g., all /docs/)
  • You want to extract an entire site section
  • Step 4 in the workflow escalation pattern: search → scrape → map → crawl → interact

Quick start

# Crawl a docs section
firecrawl crawl "<url>" --include-paths /docs --limit 50 --wait -o .firecrawl/crawl.json

# Full crawl with depth limit
firecrawl crawl "<url>" --max-depth 3 --wait --progress -o .firecrawl/crawl.json

# Check status of a running crawl
firecrawl crawl <job-id>

Options

OptionDescription
--waitWait for crawl to complete before returning
--progressShow progress while waiting
--limit <n>Max pages to crawl
--max-depth <n>Max link depth to follow
--include-paths <paths>Only crawl URLs matching these paths
--exclude-paths <paths>Skip URLs matching these paths
--delay <ms>Delay between requests
--max-concurrency <n>Max parallel crawl workers
--prettyPretty print JSON output
-o, --output <path>Output file path

Tips

  • Always use --wait when you need the results immediately. Without it, crawl returns a job ID for async polling.
  • Use --include-paths to scope the crawl — don't crawl an entire site when you only need one section.
  • Crawl consumes credits per page. Check firecrawl credit-usage before large crawls.

See also

firecrawlのその他のスキル

oracle
firecrawl
oracle CLIのベストプラクティス(プロンプトとファイルのバンドル、エンジン、セッション、ファイル添付パターン)
official
firecrawl-monitor
firecrawl
ウェブサイトのコンテンツ変更を検出し、webhookまたはメールで通知を受け取ります。cronジョブ、スクレイパー、差分スクリプトは不要です。このスキルは、ユーザーがページの変更を追跡したい、競合の価格を監視したい、新しい求人やブログ記事のアラートを受け取りたい、ドキュメント/変更履歴/ステータスページを監視したい、または「監視」「ウォッチ」「追跡」「変更があったら通知」「Xが変わったら通知」「変更があれば知らせて」「変更があったらメール」「webhookを送信」と言った場合に使用します。組み込みのAI判定機能が、フォーマット、タイムスタンプなどをフィルタリングします。
officialweb-scrapingresearch
firecrawl-deep-research
firecrawl
Firecrawlを使用して複数ソースの深層リサーチを実行します。ユーザーがトピックの調査、視点の比較、引用付きブリーフィングの作成、技術的または市場に関する質問の調査、多数のソースにわたるウェブエビデンスの統合を依頼した場合に使用します。
officialresearchweb-scraping
firecrawl-research-papers
firecrawl
Firecrawlを使用して、研究論文、ホワイトペーパー、PDF、技術レポート、学術資料を検索・統合します。ユーザーが文献レビュー、論文要約、研究動向、またはPDFや学術・業界出版物からの情報を引用した統合を求める場合に使用します。
officialresearchweb-scraping
firecrawl-market-research
firecrawl
Firecrawlを使用して、市場、財務、収益、業界、企業の指標を抽出します。ユーザーが市場調査、業界動向、公開企業データ、財務比較、収益調査、または構造化された市場レポートを求めた場合に使用します。
officialresearchweb-scraping
firecrawl-website-design-clone
firecrawl
Firecrawlのスクレイピング結果をもとに、あらゆるウェブサイトのデザインシステムをエージェント対応のDESIGN.mdに抽出します。ユーザーがウェブサイトから色、フォント、余白、コンポーネント、レイアウトパターン、ブランドやUIのガイダンスを取得し、AIエージェントが新しいウェブサイトを作成したり、見た目をクローンしたり、そのデザインにインスパイアされたページを構築できるようにする場合に使用します。
officialdesignweb-scraping
firecrawl-knowledge-base
firecrawl
Firecrawlを使ってウェブコンテンツから知識ベースを構築します。ローカル参照ドキュメント、RAG対応チャンク、ファインチューニング用データセット、ドキュメントミラー、トピックコーパス、またはウェブソースから整理されたLLM対応マークダウンとして利用できます。
officialweb-scrapingresearch
firecrawl-lead-research
firecrawl
Firecrawlを使用して、ミーティング前のリードインテリジェンスブリーフを作成します。営業電話、パートナーシップミーティング、投資家との会話、顧客インタビューの前に、企業調査、人物調査、最近のニュース、トーキングポイント、ペインポイント、アウトリーチ準備が必要な場合に使用します。
officialresearchweb-scraping