tavily-best-practices

作成者: tavily-ai

LLM向けWeb検索API。リアルタイムデータアクセス、コンテンツ抽出、サイトクローリング、AI駆動のリサーチを提供。5つのコアメソッド:search()(Web結果取得)、extract()(URLコンテンツ抽出)、crawl()(サイト全体の抽出)、map()(URL発見)、research()(エンドツーエンドのAI合成)。PythonおよびJavaScript SDKに対応し、非同期クライアントによる並列クエリと設定可能な検索深度(ultra-fast/fast/basic/advanced)をサポート。Crawlメソッドはセマンティック指示を受け付け、抽出を特定の内容に集中させる。

npx skills add https://github.com/tavily-ai/skills --skill tavily-best-practices

Tavily

Tavily is a search API designed for LLMs, enabling AI applications to access real-time web data.

Installation

Python:

pip install tavily-python

JavaScript:

npm install @tavily/core

See references/sdk.md for complete SDK reference.

Client Initialization

from tavily import TavilyClient

# Uses TAVILY_API_KEY env var (recommended)
client = TavilyClient()

#With project tracking (for usage organization)
client = TavilyClient(project_id="your-project-id")

# Async client for parallel queries
from tavily import AsyncTavilyClient
async_client = AsyncTavilyClient()

Choosing the Right Method

For custom agents/workflows:

NeedMethod
Web search resultssearch()
Content from specific URLsextract()
Content from entire sitecrawl()
URL discovery from sitemap()

For out-of-the-box research:

NeedMethod
End-to-end research with AI synthesisresearch()

Quick Reference

search() - Web Search

response = client.search(
    query="quantum computing breakthroughs",  # Keep under 400 chars
    max_results=10,
    search_depth="advanced"
)
print(response)

Key parameters: query, max_results, search_depth (ultra-fast/fast/basic/advanced), include_domains, exclude_domains, time_range

See references/search.md for complete search reference.

extract() - URL Content Extraction

# Simple one-step extraction
response = client.extract(
    urls=["https://docs.example.com"],
    extract_depth="advanced"
)
print(response)

Key parameters: urls (max 20), extract_depth, query, chunks_per_source (1-5)

See references/extract.md for complete extract reference.

crawl() - Site-Wide Extraction

response = client.crawl(
    url="https://docs.example.com",
    instructions="Find API documentation pages",  # Semantic focus
    extract_depth="advanced"
)
print(response)

Key parameters: url, max_depth, max_breadth, limit, instructions, chunks_per_source, select_paths, exclude_paths

See references/crawl.md for complete crawl reference.

map() - URL Discovery

response = client.map(
    url="https://docs.example.com"
)
print(response)

research() - AI-Powered Research

import time

# For comprehensive multi-topic research
result = client.research(
    input="Analyze competitive landscape for X in SMB market",
    model="pro"  # or "mini" for focused queries, "auto" when unsure
)
request_id = result["request_id"]

# Poll until completed
response = client.get_research(request_id)
while response["status"] not in ["completed", "failed"]:
    time.sleep(10)
    response = client.get_research(request_id)

print(response["content"])  # The research report

Key parameters: input, model ("mini"/"pro"/"auto"), stream, output_schema, citation_format

See references/research.md for complete research reference.

Detailed Guides

For complete parameters, response fields, patterns, and examples:

tavily-aiのその他のスキル

crawl
tavily-ai
ウェブサイトのコンテンツを抽出し、マークダウンファイルとして保存して、オフラインでのアクセスや分析を可能にします。クロール深度(1~5レベル)、幅の制限、ページ上限を設定可能で、カバレッジとパフォーマンスのバランスを調整できます。正規表現パターンによるパスフィルタリングをサポートし、特定のセクションに焦点を当てたり、無関係なコンテンツを除外できます。データ収集のための全ページ抽出、または結果をLLMコンテキストに取り込むための自然言語指示によるセマンティックチャンキングの2つのモードを提供します。URL用のコンパニオンMap APIも提供します...
official
extract
tavily-ai
Tavilyの抽出APIを使用して、特定のURLからクリーンなコンテンツを抽出します。1リクエストあたり最大20URLに対応し、オプションのクエリベースの再ランキングにより関連するコンテンツチャンクに焦点を当てます。2つの抽出モードがあります:高速テキスト抽出用のベーシックモードと、JavaScriptレンダリングページや構造化データ用のアドバンストモード。初回実行時にブラウザ経由で自動OAuth認証を行うか、設定で手動APIキーを構成します。マークダウンまたはプレーンテキスト形式で返され、オプションで画像URLを含み、最大60秒までのタイムアウト設定が可能です。
official
research
tavily-ai
あらゆるトピックについて、自動的な情報収集、分析、引用を伴う包括的なリサーチを実施。明示的な引用付きで複数ソースのウェブリサーチを行い、比較、時事問題、市場分析、詳細レポートに最適。3つのモデルオプションを提供:ミニ(対象を絞った単一トピックのリサーチ、約30秒)、プロ(包括的な多角的分析、約60~120秒)、オート(APIによる複雑性検出で自動選択)。Tavily MCPサーバーを通じてOAuth認証を行い、自動ブラウザベースのログインを...
official
search
tavily-ai
LLM最適化された結果、関連性スコアリング、柔軟なフィルタリングを備えたWeb検索。4つの検索深度モード(超高速、高速、基本、高度)をサポートし、レイテンシと関連性のトレードオフを設定可能。ドメインフィルタリング、時間範囲制約、日付範囲、国別ブースト、生コンテンツ抽出を含む。タイトル、URL、コンテンツスニペット、関連性スコアを含む結果を返し、オプションで画像結果とファビコンも提供。Tavily MCPサーバーまたはAPIキー設定による自動OAuth認証。
official
tavily-cli
tavily-ai
Web検索、コンテンツ抽出、サイトクローリング、およびTavily CLIによる深層リサーチ。検索、抽出、URL発見、一括クローリング、引用付きマルチソースリサーチをカバーする5つのコマンドモード。すべてのコマンドはJSON出力とファイル保存に対応し、構造化されたエージェントワークフローを実現。エスカレーションパターンにより、単純な検索から抽出、マッピング、クローリング、包括的なリサーチまで、ニーズに応じてガイド。tavily-cliのインストールと、tvly loginによるAPIキー認証が必要。
official
tavily-crawl
tavily-ai
マルチページウェブサイトクローラーで、セマンティックフィルタリングとマークダウンエクスポート機能を備えています。深さと幅を制御してサイト全体のセクションをクロールし、パス正規表現、ドメイン、または自然言語の指示でフィルタリングして結果を絞り込みます。各ページを--output-dirでローカルのマークダウンファイルとして保存するか、エージェント処理用に構造化JSONを返します。結果をLLMに渡す際のコンテキスト肥大化を防ぐために、チャンク抽出を伴うセマンティック指示を使用します。オフラインのドキュメントダウンロードには全ページ抽出を使用します。対応...
official
tavily-dynamic-search
tavily-ai
ウェブを検索し、結果をフィルタリングしてコンテンツを抽出することで、生の検索データがコンテキストウィンドウに入ることはありません。厳選されたprint()出力のみが返されます。
official
tavily-extract
tavily-ai
最大20件のURLからクリーンなマークダウンまたはテキストを抽出。JavaScriptレンダリングとクエリに焦点を当てたチャンク分割をサポート。JavaScriptでレンダリングされたページを処理し、抽出深度を設定可能(シンプルなページは基本、動的なSPAやテーブルは高度)。クエリに焦点を当てた抽出をサポートし、全ページではなく関連コンテンツのチャンクのみを返却。デフォルトでLLM最適化されたマークダウンを返し、プレーンテキスト形式や構造化JSON出力のオプションも提供。1回の呼び出しで最大20件のURLを処理。
official