tavily-map

Penemuan URL cepat di situs web tanpa mengekstrak konten, ideal untuk menemukan halaman tertentu di situs besar. Mengembalikan daftar terstruktur dari semua URL di suatu domain dengan kedalaman dan lebar yang dapat dikonfigurasi, pemfilteran jalur regex, dan instruksi bahasa alami untuk pemfilteran semantik. Mendukung kontrol kedalaman (1–5 level), batas lebar per halaman, penyertaan/pengecualian tautan eksternal, dan pemfilteran domain melalui pola regex. Dirancang sebagai langkah 1 dalam alur kerja: petakan untuk menemukan halaman yang tepat, lalu gunakan ekstrak atau...

npx skills add https://github.com/tavily-ai/skills --skill tavily-map

tavily map

Discover URLs on a website without extracting content. Faster than crawling.

Before running any command

If tvly is not found on PATH, install it first:

curl -fsSL https://cli.tavily.com/install.sh | bash && tvly login

Do not skip this step or fall back to other tools.

See tavily-cli for alternative install methods and auth options.

When to use

  • You need to find a specific subpage on a large site
  • You want a list of all URLs before deciding what to extract or crawl
  • Step 3 in the workflow: search → extract → map → crawl → research

Quick start

# Discover all URLs
tvly map "https://docs.example.com" --json

# With natural language filtering
tvly map "https://docs.example.com" --instructions "Find API docs and guides" --json

# Filter by path
tvly map "https://example.com" --select-paths "/blog/.*" --limit 500 --json

# Deep map
tvly map "https://example.com" --max-depth 3 --limit 200 --json

Options

OptionDescription
--max-depthLevels deep (1-5, default: 1)
--max-breadthLinks per page (default: 20)
--limitMax URLs to discover (default: 50)
--instructionsNatural language guidance for URL filtering
--select-pathsComma-separated regex patterns to include
--exclude-pathsComma-separated regex patterns to exclude
--select-domainsComma-separated regex for domains to include
--exclude-domainsComma-separated regex for domains to exclude
--allow-external / --no-externalInclude external links
--timeoutMax wait (10-150 seconds)
-o, --outputSave output to file
--jsonStructured JSON output

Map + Extract pattern

Use map to find the right page, then extract it. This is often more efficient than crawling an entire site:

# Step 1: Find the authentication docs
tvly map "https://docs.example.com" --instructions "authentication" --json

# Step 2: Extract the specific page you found
tvly extract "https://docs.example.com/api/authentication" --json

Tips

  • Map is URL discovery only — no content extraction. Use extract or crawl for content.
  • Map + extract beats crawl when you only need a few specific pages from a large site.
  • Use --instructions for semantic filtering when path patterns aren't enough.

See also

Lebih banyak skill dari tavily-ai

crawl
tavily-ai
Ekstrak dan simpan konten situs web sebagai file markdown untuk akses dan analisis offline. Mendukung kedalaman crawl yang dapat dikonfigurasi (1-5 level), batas luas, dan batas halaman untuk menyeimbangkan cakupan dengan kinerja. Termasuk pemfilteran jalur melalui pola regex untuk fokus pada bagian tertentu dan mengecualikan konten yang tidak relevan. Menawarkan dua mode: ekstraksi halaman penuh untuk pengumpulan data, atau pemotongan semantik dengan instruksi bahasa alami untuk memasukkan hasil ke dalam konteks LLM. Menyediakan API Peta pendamping untuk URL...
official
extract
tavily-ai
Ekstrak konten bersih dari URL tertentu menggunakan API ekstraksi Tavily. Mendukung hingga 20 URL per permintaan dengan peringkat ulang berbasis kueri opsional untuk fokus pada potongan konten yang relevan. Dua mode ekstraksi: dasar untuk ekstraksi teks cepat, lanjutan untuk halaman yang dirender JavaScript dan data terstruktur. Otentikasi OAuth otomatis melalui browser pada saat pertama kali dijalankan, atau konfigurasi kunci API manual di pengaturan. Mengembalikan format markdown atau teks biasa dengan URL gambar opsional dan batas waktu yang dapat dikonfigurasi hingga 60 detik.
official
research
tavily-ai
We need to translate the given English text into Bahasa Indonesia. The instruction says to preserve product names, protocol names, URLs, numbers, and technical terms. The name "research" is to be preserved if it appears in the source text, but we are not to include the name unless it appears. The source text does not contain the word "research" as a standalone name? Actually it starts with "Comprehensive research on any topic..." so "research" is part of the text. But the instruction says "Do not include the name unless it appears in the source text." So we keep it as is. Also preserve "Tavily MCP server", "OAuth", etc. Translate the rest naturally. Let me translate: "Comprehensive research on any topic with automatic source gathering, analysis, and citations." -> "Riset komprehensif tentang topik apa pun dengan pengumpulan sumber, analisis, dan kutipan otomatis." "Conducts multi-source web research with explicit citations, ideal for comparisons, current events, market analysis, and detailed reports
official
search
tavily-ai
Pencarian web dengan hasil yang dioptimalkan untuk LLM, penilaian relevansi, dan penyaringan fleksibel. Mendukung empat mode kedalaman pencarian (ultra-cepat, cepat, dasar, lanjutan) dengan pengaturan latensi dan tradeoff relevansi yang dapat dikonfigurasi. Termasuk penyaringan domain, batasan rentang waktu, rentang tanggal, penguatan negara, dan ekstraksi konten mentah. Mengembalikan hasil dengan judul, URL, cuplikan konten, dan skor relevansi; hasil gambar opsional dan favicon. Otentikasi OAuth otomatis melalui server Tavily MCP atau konfigurasi kunci API;...
official
tavily-best-practices
tavily-ai
API pencarian web untuk LLM dengan akses data real-time, ekstraksi konten, perayapan situs, dan riset bertenaga AI. Lima metode inti: search() untuk hasil web, extract() untuk konten URL, crawl() untuk ekstraksi seluruh situs, map() untuk penemuan URL, dan research() untuk sintesis AI ujung-ke-ujung. Mendukung SDK Python dan JavaScript dengan klien asinkron untuk kueri paralel dan kedalaman pencarian yang dapat dikonfigurasi (ultra-cepat/cepat/dasar/lanjutan). Metode crawl menerima instruksi semantik untuk memfokuskan ekstraksi pada...
official
tavily-cli
tavily-ai
Pencarian web, ekstraksi konten, perayapan situs, dan riset mendalam melalui Tavily CLI. Lima mode perintah yang mencakup pencarian, ekstraksi, penemuan URL, perayapan massal, dan riset multi-sumber dengan kutipan. Semua perintah mendukung output JSON dan penyimpanan file untuk alur kerja terstruktur dan agen. Pola eskalasi memandu Anda dari pencarian sederhana melalui ekstraksi, pemetaan, perayapan, hingga riset komprehensif berdasarkan kebutuhan Anda. Memerlukan instalasi tavily-cli dan autentikasi kunci API melalui tvly login.
official
tavily-crawl
tavily-ai
Perayap situs web multi-halaman dengan penyaringan semantik dan ekspor markdown. Jelajahi seluruh bagian situs dengan kontrol kedalaman dan luas; filter berdasarkan regex jalur, domain, atau instruksi bahasa alami untuk memfokuskan hasil. Simpan setiap halaman sebagai file markdown lokal melalui --output-dir, atau kembalikan JSON terstruktur untuk pemrosesan agen. Gunakan instruksi semantik dengan ekstraksi potongan untuk mencegah pembengkakan konteks saat memberikan hasil ke LLM; gunakan ekstraksi halaman penuh untuk unduhan dokumentasi offline. Mendukung...
official
tavily-dynamic-search
tavily-ai
Cari web, filter hasil, dan ekstrak konten sehingga data pencarian mentah tidak pernah masuk ke jendela konteks Anda. Hanya keluaran print() yang telah dikurasi yang akan kembali.
official