firecrawl-knowledge-base

โดย firecrawl

Build a knowledge base from web content with Firecrawl. Use for local reference docs, RAG-ready chunks, fine-tuning datasets, documentation mirrors, topic corpora, or LLM-ready markdown organized from web sources.

npx skills add https://github.com/firecrawl/firecrawl-workflows --skill firecrawl-knowledge-base

Firecrawl Knowledge Base

Use this to turn URLs or topics into organized LLM-ready content.

Onboarding Interview

Infer the source, goal, depth, and output location from context. If the source and goal are clear, proceed immediately.

Ask at most 1-3 concise questions only if blocked, such as the source URL/topic, whether the output is reference/RAG/training/docs, or training format if training is requested.

Firecrawl Collection Plan

Use Firecrawl map for documentation sites, search for topic-based corpora, scrape pages into markdown, and preserve code examples and tables.

For files, follow the Firecrawl download-style convention:

.firecrawl/
  <hostname>/
    <path>/
      index.md

Parallel Work

If appropriate, use sub-agents or equivalent parallel task runners:

  • one docs section per researcher
  • official docs, tutorials, community discussions, and references by source type
  • source scraping vs chunk generation vs manifest generation

Output Modes

  • Reference: markdown files, index.md, and sources.json.
  • RAG: markdown files plus chunk files and manifest.json.
  • Training: scraped source files plus training-data.jsonl and training-metadata.json.
  • Docs mirror: complete markdown mirror with a table of contents.

Final Deliverable

# Knowledge Base: [Source]

## Summary
[What was collected and why]

## Output Structure
[Files/directories created]

## Coverage
[Sections, source types, counts]

## Usage Notes
[How to use in RAG, docs, training, or agent context]

## Sources
[URLs collected]

## Rerun Inputs
workflow: firecrawl-knowledge-base
source: [url/topic]
goal: [reference/rag/train/docs]
depth: [quick/thorough/exhaustive]
output_dir: [.firecrawl/]

Quality Bar

  • Preserve code examples and formatting.
  • Remove boilerplate navigation where possible.
  • Include source URLs in frontmatter or metadata.

Skills เพิ่มเติมจาก firecrawl

oracle
firecrawl
แนวทางปฏิบัติที่ดีที่สุดสำหรับการใช้ oracle CLI (การรวม prompt และไฟล์, เอ็นจิน, เซสชัน, และรูปแบบการแนบไฟล์)
official
firecrawl-monitor
firecrawl
ตรวจจับเมื่อเนื้อหาบนเว็บไซต์เปลี่ยนแปลงและรับการแจ้งเตือนทางเว็บฮุคหรืออีเมล — ไม่ต้องใช้ cron jobs, scrapers หรือ diff scripts ใช้สกิลนี้เมื่อผู้ใช้ต้องการติดตามการเปลี่ยนแปลงบนหน้าเว็บ ดูราคาคู่แข่ง แจ้งเตือนเมื่อมีประกาศรับสมัครงานหรือโพสต์บล็อกใหม่ ติดตามหน้าเอกสาร/บันทึกการเปลี่ยนแปลง/สถานะ หรือพูดว่า "มอนิเตอร์" "ดู" "ติดตาม" "แจ้งเตือนฉันเมื่อ" "แจ้งเตือนเมื่อ X เปลี่ยนแปลง" "ส่งข้อความหาฉันถ้า" "ส่งอีเมลถึงฉันเมื่อ" หรือ "ส่งเว็บฮุคเมื่อ" ผู้ตัดสิน AI ในตัวจะกรองการจัดรูปแบบ การประทับเวลา และ...
officialweb-scrapingresearch
firecrawl-deep-research
firecrawl
ดำเนินการวิจัยเชิงลึกจากหลายแหล่งที่มาด้วย Firecrawl ใช้เมื่อผู้ใช้ขอให้ค้นคว้าหัวข้อ เปรียบเทียบมุมมอง จัดทำสรุปข้อมูลพร้อมแหล่งอ้างอิง สอบถามประเด็นทางเทคนิคหรือตลาด หรือสังเคราะห์หลักฐานจากเว็บจากหลายแหล่ง
officialresearchweb-scraping
firecrawl-research-papers
firecrawl
ค้นหาและสังเคราะห์เอกสารวิจัย เอกสารไวท์เปเปอร์ ไฟล์ PDF รายงานทางเทคนิค และแหล่งข้อมูลทางวิชาการด้วย Firecrawl ใช้เมื่อผู้ใช้ต้องการทบทวนวรรณกรรม สรุปเอกสาร ภาพรวมงานวิจัย หรือการสังเคราะห์ที่มีแหล่งอ้างอิงจากไฟล์ PDF และสิ่งพิมพ์ทางวิชาการ/อุตสาหกรรม
officialresearchweb-scraping
firecrawl-market-research
firecrawl
ดึงข้อมูลตลาด การเงิน รายได้ อุตสาหกรรม และเมตริกของบริษัทด้วย Firecrawl ใช้เมื่อผู้ใช้สอบถามเกี่ยวกับการวิจัยตลาด แนวโน้มอุตสาหกรรม ข้อมูลบริษัทมหาชน การเปรียบเทียบทางการเงิน การวิจัยรายได้ หรือรายงานตลาดที่มีโครงสร้าง
officialresearchweb-scraping
firecrawl-website-design-clone
firecrawl
ดึงระบบการออกแบบของเว็บไซต์ใดๆ ออกมาเป็น DESIGN.md ที่พร้อมใช้งานสำหรับเอเจนต์ โดยใช้หลักฐานจากการสืบค้นด้วย Firecrawl ใช้เมื่อผู้ใช้ต้องการสี ฟอนต์ ระยะห่าง คอมโพเนนต์ รูปแบบเลย์เอาต์ หรือคำแนะนำด้านแบรนด์/UI จากเว็บไซต์ เพื่อให้เอเจนต์ AI สามารถสร้างเว็บไซต์ใหม่ เลียนแบบรูปลักษณ์ หรือสร้างหน้าที่ได้รับแรงบันดาลใจจากการออกแบบนั้น
officialdesignweb-scraping
firecrawl-lead-research
firecrawl
สร้างรายงานสรุปข้อมูลลูกค้าเป้าหมายก่อนการประชุมด้วย Firecrawl ใช้เมื่อผู้ใช้ต้องการค้นหาข้อมูลบริษัท ข้อมูลบุคคล ข่าวล่าสุด ประเด็นพูดคุย จุดเจ็บปวด หรือเตรียมการติดต่อก่อนการโทรขาย การประชุมพันธมิตร การสนทนากับนักลงทุน หรือการสัมภาษณ์ลูกค้า
officialresearchweb-scraping
firecrawl-dashboard-reporting
firecrawl
ดึงเมตริกจากแดชบอร์ดวิเคราะห์และเครื่องมือเว็บภายในด้วยเบราว์เซอร์ Firecrawl ใช้เมื่อผู้ใช้ต้องการรายงานจากแดชบอร์ด สรุปเมตริกข้ามแพลตฟอร์ม การดึงข้อมูลวิเคราะห์ที่ต้องยืนยันตัวตน รายงานตามช่วงวันที่ หรือเมตริกที่มีโครงสร้างจากแดชบอร์ดเว็บ
officialbrowser-automationdata-analysis