firecrawl-build-scrape

Integrate Firecrawl `/scrape` into product code for single-page extraction. Use when an app already has a URL and needs markdown, HTML, links, screenshots,…

npx skills add https://github.com/firecrawl/skills --skill firecrawl-build-scrape

Descargar ZIP GitHub

Firecrawl Build Scrape

Use this when the application already has the URL and needs content from one page.

Use This When

the feature starts from a known URL
you need page content for retrieval, summarization, enrichment, or monitoring
you want the default extraction primitive before considering /interact

Default Recommendations

Return markdown unless the feature truly needs another format.
Use onlyMainContent for article-like pages where nav and chrome add noise.
Add waits or other rendering options only when the page needs them.

Common Product Patterns

knowledge ingestion from known URLs
enrichment from a company, product, or docs page
pricing, changelog, and documentation extraction
page-level quality checks or monitoring

Escalation Rules

If you do not have the URL yet, start with firecrawl-build-search.
If content requires clicks, typing, or multi-step navigation, escalate to firecrawl-build-interact.

Implementation Notes

Keep the integration narrow: one feature, one URL, one extraction contract.
Treat /scrape as the default primitive for downstream LLM or indexing pipelines.
Request richer formats only when the consumer needs them, such as links, screenshots, or branding data.

Docs (Source of Truth)

Read the source-of-truth page for your project language before writing integration code:

Node / TypeScript: docs.firecrawl.dev/agent-source-of-truth/node
Python: docs.firecrawl.dev/agent-source-of-truth/python
Rust: docs.firecrawl.dev/agent-source-of-truth/rust
Java: docs.firecrawl.dev/agent-source-of-truth/java
Elixir: docs.firecrawl.dev/agent-source-of-truth/elixir
cURL / REST: docs.firecrawl.dev/agent-source-of-truth/curl

See Also

Más skills de firecrawl

Mejores prácticas para usar la CLI de oracle (prompt + agrupación de archivos, motores, sesiones y patrones de adjuntar archivos).

firecrawl-monitor

Detecta cuándo cambia el contenido de un sitio web y recibe notificaciones por webhook o correo electrónico, sin necesidad de cron jobs, scrapers ni scripts de diferencias. Usa esta habilidad cada vez que el usuario quiera rastrear cambios en una página, monitorear precios de la competencia, recibir alertas sobre nuevas ofertas de trabajo o publicaciones de blog, supervisar páginas de documentación/changelog/estado, o diga "monitorear", "vigilar", "rastrear", "alertarme cuando", "notificarme cuando X cambie", "avísame si", "enviarme un correo cuando" o "enviar un webhook cuando". Un juez de IA integrado filtra formato, marcas de tiempo y...

officialweb-scrapingresearch

firecrawl-deep-research

Realizar investigación profunda de múltiples fuentes con Firecrawl. Usar cuando el usuario solicite investigar un tema, comparar perspectivas, producir un informe con fuentes, indagar una pregunta técnica o de mercado, o sintetizar evidencia web de muchas fuentes.

officialresearchweb-scraping

firecrawl-research-papers

Encuentra y sintetiza artículos de investigación, documentos técnicos, PDFs, informes técnicos y fuentes académicas con Firecrawl. Úsalo cuando el usuario quiera una revisión bibliográfica, resumen de artículos, panorama de investigación o síntesis con fuentes de PDFs y publicaciones académicas o de la industria.

officialresearchweb-scraping

firecrawl-market-research

Extrae métricas de mercado, financieras, de ganancias, industriales y de empresas con Firecrawl. Úsalo cuando el usuario solicite investigación de mercado, tendencias de la industria, datos de empresas públicas, comparaciones financieras, investigación de ganancias o informes de mercado estructurados.

officialresearchweb-scraping

firecrawl-website-design-clone

Extrae el sistema de diseño de cualquier sitio web y conviértelo en un DESIGN.md listo para agentes, utilizando evidencia extraída con Firecrawl. Úsalo cuando el usuario quiera colores, fuentes, espaciados, componentes, patrones de diseño o guías de marca/interfaz de un sitio web, para que agentes de IA puedan crear nuevos sitios, clonar una apariencia o construir páginas inspiradas en ese diseño.

officialdesignweb-scraping

firecrawl-knowledge-base

Construye una base de conocimiento a partir de contenido web con Firecrawl. Úsalo para documentación de referencia local, fragmentos listos para RAG, conjuntos de datos para ajuste fino, espejos de documentación, corpus temáticos o markdown listo para LLM organizado desde fuentes web.

officialweb-scrapingresearch

firecrawl-lead-research

Producir resúmenes de inteligencia de prospectos previos a reuniones con Firecrawl. Usar cuando el usuario necesite investigación de empresas, investigación de personas, noticias recientes, puntos de conversación, puntos débiles o preparación para contactos antes de una llamada de ventas, reunión de asociación, conversación con inversores o entrevista con clientes.

officialresearchweb-scraping