firecrawl-parse
作成者: firecrawl
ローカルドキュメントをクリーンなマークダウンに変換してディスクに保存します。対応形式:PDF、DOCX、DOC、ODT、RTF、XLSX、XLS、HTML/HTM/XHTML。
npx skills add https://github.com/firecrawl/cli --skill firecrawl-parsefirecrawl parse
Turn a local document into clean markdown on disk. Supports PDF, DOCX, DOC, ODT, RTF, XLSX, XLS, HTML/HTM/XHTML.
When to use
- You have a file on disk (not a URL) and want its text as markdown
- User drops a PDF/DOCX and asks what it says, or to summarize it
- Use
scrapeinstead when the source is a URL
Quick start
Always save to .firecrawl/ with -o — parsed docs can be hundreds of KB and blow up context if streamed to stdout. Add .firecrawl/ to .gitignore.
mkdir -p .firecrawl
# File → markdown
firecrawl parse ./paper.pdf -o .firecrawl/paper.md
# AI summary
firecrawl parse ./paper.pdf -S -o .firecrawl/paper-summary.md
# Ask a question about the doc
firecrawl parse ./paper.pdf -Q "What are the main conclusions?" \
-o .firecrawl/paper-qa.md
Then head, grep, rg etc., or incrementally read the file - don't load the whole thing at once.
Options
| Option | Description |
|---|---|
-S, --summary | AI-generated summary |
-Q, --query <prompt> | Ask a question about the parsed content |
-o, --output <path> | Output file path — always use this |
-f, --format <fmt> | markdown (default), html, summary |
--timeout <ms> | Timeout for the parse job |
--timing | Show request duration |
Tips
- Quote paths with spaces:
firecrawl parse "./My Doc.pdf" -o .firecrawl/mydoc.md. - Max upload size: 50 MB per file.
- Credits: ~1 per PDF page; HTML is 1 flat.
- Check
.firecrawl/before re-parsing the same file. - To check your credit balance (recommended for batch processing and similar workflows), use the
firecrawl credit-usagecommand.
See also
- firecrawl-scrape — same idea for URLs
firecrawlのその他のスキル
oracle
firecrawl
oracle CLIのベストプラクティス(プロンプトとファイルのバンドル、エンジン、セッション、ファイル添付パターン)
official
firecrawl-monitor
firecrawl
ウェブサイトのコンテンツ変更を検出し、webhookまたはメールで通知を受け取ります。cronジョブ、スクレイパー、差分スクリプトは不要です。このスキルは、ユーザーがページの変更を追跡したい、競合の価格を監視したい、新しい求人やブログ記事のアラートを受け取りたい、ドキュメント/変更履歴/ステータスページを監視したい、または「監視」「ウォッチ」「追跡」「変更があったら通知」「Xが変わったら通知」「変更があれば知らせて」「変更があったらメール」「webhookを送信」と言った場合に使用します。組み込みのAI判定機能が、フォーマット、タイムスタンプなどをフィルタリングします。
officialweb-scrapingresearch
firecrawl-deep-research
firecrawl
Firecrawlを使用して複数ソースの深層リサーチを実行します。ユーザーがトピックの調査、視点の比較、引用付きブリーフィングの作成、技術的または市場に関する質問の調査、多数のソースにわたるウェブエビデンスの統合を依頼した場合に使用します。
officialresearchweb-scraping
firecrawl-research-papers
firecrawl
Firecrawlを使用して、研究論文、ホワイトペーパー、PDF、技術レポート、学術資料を検索・統合します。ユーザーが文献レビュー、論文要約、研究動向、またはPDFや学術・業界出版物からの情報を引用した統合を求める場合に使用します。
officialresearchweb-scraping
firecrawl-market-research
firecrawl
Firecrawlを使用して、市場、財務、収益、業界、企業の指標を抽出します。ユーザーが市場調査、業界動向、公開企業データ、財務比較、収益調査、または構造化された市場レポートを求めた場合に使用します。
officialresearchweb-scraping
firecrawl-website-design-clone
firecrawl
Firecrawlのスクレイピング結果をもとに、あらゆるウェブサイトのデザインシステムをエージェント対応のDESIGN.mdに抽出します。ユーザーがウェブサイトから色、フォント、余白、コンポーネント、レイアウトパターン、ブランドやUIのガイダンスを取得し、AIエージェントが新しいウェブサイトを作成したり、見た目をクローンしたり、そのデザインにインスパイアされたページを構築できるようにする場合に使用します。
officialdesignweb-scraping
firecrawl-knowledge-base
firecrawl
Firecrawlを使ってウェブコンテンツから知識ベースを構築します。ローカル参照ドキュメント、RAG対応チャンク、ファインチューニング用データセット、ドキュメントミラー、トピックコーパス、またはウェブソースから整理されたLLM対応マークダウンとして利用できます。
officialweb-scrapingresearch
firecrawl-lead-research
firecrawl
Firecrawlを使用して、ミーティング前のリードインテリジェンスブリーフを作成します。営業電話、パートナーシップミーティング、投資家との会話、顧客インタビューの前に、企業調査、人物調査、最近のニュース、トーキングポイント、ペインポイント、アウトリーチ準備が必要な場合に使用します。
officialresearchweb-scraping