tavily-map

作成者: tavily-ai

ウェブサイトからコンテンツを抽出せずに高速なURL発見が可能で、大規模サイト上の特定ページを見つけるのに最適です。設定可能な深さと幅、正規表現によるパスフィルタリング、セマンティックフィルタリングのための自然言語指示を用いて、ドメイン上の全URLの構造化リストを返します。深さ制御(1~5レベル)、ページごとの幅制限、外部リンクの包含/除外、正規表現パターンによるドメインフィルタリングをサポートします。ワークフローのステップ1として設計されており、マッピングで目的のページを見つけ、その後抽出や...を使用します。

npx skills add https://github.com/tavily-ai/skills --skill tavily-map

tavily map

Discover URLs on a website without extracting content. Faster than crawling.

Before running any command

If tvly is not found on PATH, install it first:

curl -fsSL https://cli.tavily.com/install.sh | bash && tvly login

Do not skip this step or fall back to other tools.

See tavily-cli for alternative install methods and auth options.

When to use

  • You need to find a specific subpage on a large site
  • You want a list of all URLs before deciding what to extract or crawl
  • Step 3 in the workflow: search → extract → map → crawl → research

Quick start

# Discover all URLs
tvly map "https://docs.example.com" --json

# With natural language filtering
tvly map "https://docs.example.com" --instructions "Find API docs and guides" --json

# Filter by path
tvly map "https://example.com" --select-paths "/blog/.*" --limit 500 --json

# Deep map
tvly map "https://example.com" --max-depth 3 --limit 200 --json

Options

OptionDescription
--max-depthLevels deep (1-5, default: 1)
--max-breadthLinks per page (default: 20)
--limitMax URLs to discover (default: 50)
--instructionsNatural language guidance for URL filtering
--select-pathsComma-separated regex patterns to include
--exclude-pathsComma-separated regex patterns to exclude
--select-domainsComma-separated regex for domains to include
--exclude-domainsComma-separated regex for domains to exclude
--allow-external / --no-externalInclude external links
--timeoutMax wait (10-150 seconds)
-o, --outputSave output to file
--jsonStructured JSON output

Map + Extract pattern

Use map to find the right page, then extract it. This is often more efficient than crawling an entire site:

# Step 1: Find the authentication docs
tvly map "https://docs.example.com" --instructions "authentication" --json

# Step 2: Extract the specific page you found
tvly extract "https://docs.example.com/api/authentication" --json

Tips

  • Map is URL discovery only — no content extraction. Use extract or crawl for content.
  • Map + extract beats crawl when you only need a few specific pages from a large site.
  • Use --instructions for semantic filtering when path patterns aren't enough.

See also

tavily-aiのその他のスキル

crawl
tavily-ai
ウェブサイトのコンテンツを抽出し、マークダウンファイルとして保存して、オフラインでのアクセスや分析を可能にします。クロール深度(1~5レベル)、幅の制限、ページ上限を設定可能で、カバレッジとパフォーマンスのバランスを調整できます。正規表現パターンによるパスフィルタリングをサポートし、特定のセクションに焦点を当てたり、無関係なコンテンツを除外できます。データ収集のための全ページ抽出、または結果をLLMコンテキストに取り込むための自然言語指示によるセマンティックチャンキングの2つのモードを提供します。URL用のコンパニオンMap APIも提供します...
official
extract
tavily-ai
Tavilyの抽出APIを使用して、特定のURLからクリーンなコンテンツを抽出します。1リクエストあたり最大20URLに対応し、オプションのクエリベースの再ランキングにより関連するコンテンツチャンクに焦点を当てます。2つの抽出モードがあります:高速テキスト抽出用のベーシックモードと、JavaScriptレンダリングページや構造化データ用のアドバンストモード。初回実行時にブラウザ経由で自動OAuth認証を行うか、設定で手動APIキーを構成します。マークダウンまたはプレーンテキスト形式で返され、オプションで画像URLを含み、最大60秒までのタイムアウト設定が可能です。
official
research
tavily-ai
あらゆるトピックについて、自動的な情報収集、分析、引用を伴う包括的なリサーチを実施。明示的な引用付きで複数ソースのウェブリサーチを行い、比較、時事問題、市場分析、詳細レポートに最適。3つのモデルオプションを提供:ミニ(対象を絞った単一トピックのリサーチ、約30秒)、プロ(包括的な多角的分析、約60~120秒)、オート(APIによる複雑性検出で自動選択)。Tavily MCPサーバーを通じてOAuth認証を行い、自動ブラウザベースのログインを...
official
search
tavily-ai
LLM最適化された結果、関連性スコアリング、柔軟なフィルタリングを備えたWeb検索。4つの検索深度モード(超高速、高速、基本、高度)をサポートし、レイテンシと関連性のトレードオフを設定可能。ドメインフィルタリング、時間範囲制約、日付範囲、国別ブースト、生コンテンツ抽出を含む。タイトル、URL、コンテンツスニペット、関連性スコアを含む結果を返し、オプションで画像結果とファビコンも提供。Tavily MCPサーバーまたはAPIキー設定による自動OAuth認証。
official
tavily-best-practices
tavily-ai
LLM向けWeb検索API。リアルタイムデータアクセス、コンテンツ抽出、サイトクローリング、AI駆動のリサーチを提供。5つのコアメソッド:search()(Web結果取得)、extract()(URLコンテンツ抽出)、crawl()(サイト全体の抽出)、map()(URL発見)、research()(エンドツーエンドのAI合成)。PythonおよびJavaScript SDKに対応し、非同期クライアントによる並列クエリと設定可能な検索深度(ultra-fast/fast/basic/advanced)をサポート。Crawlメソッドはセマンティック指示を受け付け、抽出を特定の内容に集中させる。
official
tavily-cli
tavily-ai
Web検索、コンテンツ抽出、サイトクローリング、およびTavily CLIによる深層リサーチ。検索、抽出、URL発見、一括クローリング、引用付きマルチソースリサーチをカバーする5つのコマンドモード。すべてのコマンドはJSON出力とファイル保存に対応し、構造化されたエージェントワークフローを実現。エスカレーションパターンにより、単純な検索から抽出、マッピング、クローリング、包括的なリサーチまで、ニーズに応じてガイド。tavily-cliのインストールと、tvly loginによるAPIキー認証が必要。
official
tavily-crawl
tavily-ai
マルチページウェブサイトクローラーで、セマンティックフィルタリングとマークダウンエクスポート機能を備えています。深さと幅を制御してサイト全体のセクションをクロールし、パス正規表現、ドメイン、または自然言語の指示でフィルタリングして結果を絞り込みます。各ページを--output-dirでローカルのマークダウンファイルとして保存するか、エージェント処理用に構造化JSONを返します。結果をLLMに渡す際のコンテキスト肥大化を防ぐために、チャンク抽出を伴うセマンティック指示を使用します。オフラインのドキュメントダウンロードには全ページ抽出を使用します。対応...
official
tavily-dynamic-search
tavily-ai
ウェブを検索し、結果をフィルタリングしてコンテンツを抽出することで、生の検索データがコンテキストウィンドウに入ることはありません。厳選されたprint()出力のみが返されます。
official