firecrawl-parse

作成者： firecrawl

ローカルドキュメントをクリーンなマークダウンに変換してディスクに保存します。対応形式：PDF、DOCX、DOC、ODT、RTF、XLSX、XLS、HTML/HTM/XHTML。

npx skills add https://github.com/firecrawl/cli --skill firecrawl-parse

ZIPダウンロード GitHub

firecrawl parse

Turn a local document into clean markdown on disk. Supports PDF, DOCX, DOC, ODT, RTF, XLSX, XLS, HTML/HTM/XHTML.

When to use

You have a file on disk (not a URL) and want its text as markdown
User drops a PDF/DOCX and asks what it says, or to summarize it
Use scrape instead when the source is a URL

Quick start

Always save to .firecrawl/ with -o — parsed docs can be hundreds of KB and blow up context if streamed to stdout. Add .firecrawl/ to .gitignore.

mkdir -p .firecrawl

# File → markdown
firecrawl parse ./paper.pdf -o .firecrawl/paper.md

# AI summary
firecrawl parse ./paper.pdf -S -o .firecrawl/paper-summary.md

# Ask a question about the doc
firecrawl parse ./paper.pdf -Q "What are the main conclusions?" \
  -o .firecrawl/paper-qa.md

Then head, grep, rg etc., or incrementally read the file - don't load the whole thing at once.

Options

Option	Description
`-S, --summary`	AI-generated summary
`-Q, --query <prompt>`	Ask a question about the parsed content
`-o, --output <path>`	Output file path — always use this
`-f, --format <fmt>`	`markdown` (default), `html`, `summary`
`--timeout <ms>`	Timeout for the parse job
`--timing`	Show request duration

Tips

Quote paths with spaces: firecrawl parse "./My Doc.pdf" -o .firecrawl/mydoc.md.
Max upload size: 50 MB per file.
Credits: ~1 per PDF page; HTML is 1 flat.
Check .firecrawl/ before re-parsing the same file.
To check your credit balance (recommended for batch processing and similar workflows), use the firecrawl credit-usage command.

See also

firecrawl-scrape — same idea for URLs

firecrawlのその他のスキル

oracle CLIのベストプラクティス（プロンプトとファイルのバンドル、エンジン、セッション、ファイル添付パターン）

firecrawl-monitor

ウェブサイトのコンテンツ変更を検出し、webhookまたはメールで通知を受け取ります。cronジョブ、スクレイパー、差分スクリプトは不要です。このスキルは、ユーザーがページの変更を追跡したい、競合の価格を監視したい、新しい求人やブログ記事のアラートを受け取りたい、ドキュメント/変更履歴/ステータスページを監視したい、または「監視」「ウォッチ」「追跡」「変更があったら通知」「Xが変わったら通知」「変更があれば知らせて」「変更があったらメール」「webhookを送信」と言った場合に使用します。組み込みのAI判定機能が、フォーマット、タイムスタンプなどをフィルタリングします。

officialweb-scrapingresearch

firecrawl-deep-research

Firecrawlを使用して複数ソースの深層リサーチを実行します。ユーザーがトピックの調査、視点の比較、引用付きブリーフィングの作成、技術的または市場に関する質問の調査、多数のソースにわたるウェブエビデンスの統合を依頼した場合に使用します。

officialresearchweb-scraping

firecrawl-research-papers

Firecrawlを使用して、研究論文、ホワイトペーパー、PDF、技術レポート、学術資料を検索・統合します。ユーザーが文献レビュー、論文要約、研究動向、またはPDFや学術・業界出版物からの情報を引用した統合を求める場合に使用します。

officialresearchweb-scraping

firecrawl-market-research

Firecrawlを使用して、市場、財務、収益、業界、企業の指標を抽出します。ユーザーが市場調査、業界動向、公開企業データ、財務比較、収益調査、または構造化された市場レポートを求めた場合に使用します。

officialresearchweb-scraping

firecrawl-website-design-clone

Firecrawlのスクレイピング結果をもとに、あらゆるウェブサイトのデザインシステムをエージェント対応のDESIGN.mdに抽出します。ユーザーがウェブサイトから色、フォント、余白、コンポーネント、レイアウトパターン、ブランドやUIのガイダンスを取得し、AIエージェントが新しいウェブサイトを作成したり、見た目をクローンしたり、そのデザインにインスパイアされたページを構築できるようにする場合に使用します。

officialdesignweb-scraping

firecrawl-knowledge-base

Firecrawlを使ってウェブコンテンツから知識ベースを構築します。ローカル参照ドキュメント、RAG対応チャンク、ファインチューニング用データセット、ドキュメントミラー、トピックコーパス、またはウェブソースから整理されたLLM対応マークダウンとして利用できます。

officialweb-scrapingresearch

firecrawl-lead-research

Firecrawlを使用して、ミーティング前のリードインテリジェンスブリーフを作成します。営業電話、パートナーシップミーティング、投資家との会話、顧客インタビューの前に、企業調査、人物調査、最近のニュース、トーキングポイント、ペインポイント、アウトリーチ準備が必要な場合に使用します。

officialresearchweb-scraping