firecrawl-knowledge-ingest

Ингрестируйте публичные или аутентифицированные базы знаний и порталы документации с помощью браузера Firecrawl. Используйте для документации с интенсивным использованием JavaScript, порталов с входом по логину, постраничных справочных центров, баз знаний поддержки или структурированного извлечения JSON/markdown с сайтов документации.

npx skills add https://github.com/firecrawl/firecrawl-workflows --skill firecrawl-knowledge-ingest

Firecrawl Knowledge Ingest

Use this when a docs portal needs browser navigation, auth, pagination, or JS rendering.

Onboarding Interview

Infer the portal URL, output format, auth needs, and page limit from context. If the portal is clear, proceed immediately.

Ask at most 1-3 concise questions only if blocked, such as the portal URL, whether authentication is required, or the desired output format.

Firecrawl Collection Plan

Use Firecrawl browser to:

  • open the portal and inspect navigation
  • identify sections, categories, sidebar links, and article URLs
  • follow sidebar navigation, next links, pagination, load-more controls, or search
  • scrape article content as markdown
  • extract metadata such as title, section, last updated date, author, and tags

Try Firecrawl map as a supplement for public URLs, but use browser navigation for auth-gated or JS-heavy content.

Final Deliverable

# Knowledge Ingest: [Portal]

## Summary
[Pages extracted, sections covered, limitations]

## Output
[JSON/markdown/merged file path or content]

## Sections
[Section names and article counts]

## Failed Or Restricted Pages
[Any access/loading issues]

## Sources
[URLs extracted]

## Rerun Inputs
workflow: firecrawl-knowledge-ingest
url: [portal url]
format: [json/markdown/merged]
max_pages: [number]

JSON Shape

Use source, url, extractedAt, totalArticles, and sections[] with article title, url, section, content, and metadata.

Quality Bar

  • Preserve code examples, tables, and formatting.
  • Strip nav chrome, headers, and footers.
  • Track extraction progress and page failures.
  • Respect authentication boundaries.

Больше skills от firecrawl

oracle
firecrawl
Best practices for using the oracle CLI (prompt + file bundling, engines, sessions, and file attachment patterns).
official
firecrawl-monitor
firecrawl
Обнаруживайте изменения содержимого на веб-сайте и получайте уведомления через вебхук или электронную почту — без cron-задач, парсеров или скриптов сравнения. Используйте этот навык, когда пользователь хочет отслеживать изменения на странице, следить за ценами конкурентов, получать оповещения о новых вакансиях или записях в блоге, мониторить страницы документации/списка изменений/статуса, или говорит «отслеживать», «наблюдать», «мониторить», «уведомить меня, когда», «сообщить, когда X изменится», «напомнить мне, если», «отправить письмо, когда» или «отправить вебхук, когда». Встроенный AI-судья отфильтровывает форматирование, временные метки и...
officialweb-scrapingresearch
firecrawl-deep-research
firecrawl
Запустить многопоточное глубокое исследование с помощью Firecrawl. Используйте, когда пользователь просит исследовать тему, сравнить точки зрения, подготовить обзор с источниками, изучить технический или рыночный вопрос или обобщить веб-данные из множества источников.
officialresearchweb-scraping
firecrawl-research-papers
firecrawl
Находить и обобщать исследовательские статьи, технические отчёты, PDF-документы и академические источники с помощью Firecrawl. Используйте, когда пользователю нужен литературный обзор, краткое содержание статьи, обзор исследований или обобщение с источниками из PDF и научных/отраслевых публикаций.
officialresearchweb-scraping
firecrawl-market-research
firecrawl
Извлекайте рыночные, финансовые, показатели прибыли, отраслевые и корпоративные метрики с помощью Firecrawl. Используйте, когда пользователь запрашивает маркетинговые исследования, отраслевые тренды, данные публичных компаний, финансовые сравнения, анализ прибыли или структурированные рыночные отчеты.
officialresearchweb-scraping
firecrawl-website-design-clone
firecrawl
Извлеките дизайн-систему любого веб-сайта в файл DESIGN.md, готовый для агентов, используя данные скрапинга Firecrawl. Используйте, когда пользователю нужны цвета, шрифты, отступы, компоненты, шаблоны макетов или рекомендации по бренду/UI с веб-сайта, чтобы AI-агенты могли создавать новые сайты, клонировать внешний вид или строить страницы, вдохновлённые этим дизайном.
officialdesignweb-scraping
firecrawl-knowledge-base
firecrawl
Создайте базу знаний из веб-контента с помощью Firecrawl. Используйте для локальной справочной документации, чанков, готовых для RAG, наборов данных для тонкой настройки, зеркал документации, тематических корпусов или размеченного в формате Markdown, готового для LLM, организованного из веб-источников.
officialweb-scrapingresearch
firecrawl-lead-research
firecrawl
Создавайте краткие разведывательные сводки о лидах перед встречами с помощью Firecrawl. Используйте, когда пользователю нужно исследование компании, исследование человека, последние новости, темы для обсуждения, болевые точки или подготовка к обращению перед продажным звонком, встречей о партнерстве, разговором с инвестором или интервью с клиентом.
officialresearchweb-scraping