tavily-best-practices

API pencarian web untuk LLM dengan akses data real-time, ekstraksi konten, perayapan situs, dan riset bertenaga AI. Lima metode inti: search() untuk hasil web, extract() untuk konten URL, crawl() untuk ekstraksi seluruh situs, map() untuk penemuan URL, dan research() untuk sintesis AI ujung-ke-ujung. Mendukung SDK Python dan JavaScript dengan klien asinkron untuk kueri paralel dan kedalaman pencarian yang dapat dikonfigurasi (ultra-cepat/cepat/dasar/lanjutan). Metode crawl menerima instruksi semantik untuk memfokuskan ekstraksi pada...

npx skills add https://github.com/tavily-ai/skills --skill tavily-best-practices

Tavily

Tavily is a search API designed for LLMs, enabling AI applications to access real-time web data.

Installation

Python:

pip install tavily-python

JavaScript:

npm install @tavily/core

See references/sdk.md for complete SDK reference.

Client Initialization

from tavily import TavilyClient

# Uses TAVILY_API_KEY env var (recommended)
client = TavilyClient()

#With project tracking (for usage organization)
client = TavilyClient(project_id="your-project-id")

# Async client for parallel queries
from tavily import AsyncTavilyClient
async_client = AsyncTavilyClient()

Choosing the Right Method

For custom agents/workflows:

NeedMethod
Web search resultssearch()
Content from specific URLsextract()
Content from entire sitecrawl()
URL discovery from sitemap()

For out-of-the-box research:

NeedMethod
End-to-end research with AI synthesisresearch()

Quick Reference

search() - Web Search

response = client.search(
    query="quantum computing breakthroughs",  # Keep under 400 chars
    max_results=10,
    search_depth="advanced"
)
print(response)

Key parameters: query, max_results, search_depth (ultra-fast/fast/basic/advanced), include_domains, exclude_domains, time_range

See references/search.md for complete search reference.

extract() - URL Content Extraction

# Simple one-step extraction
response = client.extract(
    urls=["https://docs.example.com"],
    extract_depth="advanced"
)
print(response)

Key parameters: urls (max 20), extract_depth, query, chunks_per_source (1-5)

See references/extract.md for complete extract reference.

crawl() - Site-Wide Extraction

response = client.crawl(
    url="https://docs.example.com",
    instructions="Find API documentation pages",  # Semantic focus
    extract_depth="advanced"
)
print(response)

Key parameters: url, max_depth, max_breadth, limit, instructions, chunks_per_source, select_paths, exclude_paths

See references/crawl.md for complete crawl reference.

map() - URL Discovery

response = client.map(
    url="https://docs.example.com"
)
print(response)

research() - AI-Powered Research

import time

# For comprehensive multi-topic research
result = client.research(
    input="Analyze competitive landscape for X in SMB market",
    model="pro"  # or "mini" for focused queries, "auto" when unsure
)
request_id = result["request_id"]

# Poll until completed
response = client.get_research(request_id)
while response["status"] not in ["completed", "failed"]:
    time.sleep(10)
    response = client.get_research(request_id)

print(response["content"])  # The research report

Key parameters: input, model ("mini"/"pro"/"auto"), stream, output_schema, citation_format

See references/research.md for complete research reference.

Detailed Guides

For complete parameters, response fields, patterns, and examples:

Lebih banyak skill dari tavily-ai

crawl
tavily-ai
Ekstrak dan simpan konten situs web sebagai file markdown untuk akses dan analisis offline. Mendukung kedalaman crawl yang dapat dikonfigurasi (1-5 level), batas luas, dan batas halaman untuk menyeimbangkan cakupan dengan kinerja. Termasuk pemfilteran jalur melalui pola regex untuk fokus pada bagian tertentu dan mengecualikan konten yang tidak relevan. Menawarkan dua mode: ekstraksi halaman penuh untuk pengumpulan data, atau pemotongan semantik dengan instruksi bahasa alami untuk memasukkan hasil ke dalam konteks LLM. Menyediakan API Peta pendamping untuk URL...
official
extract
tavily-ai
Ekstrak konten bersih dari URL tertentu menggunakan API ekstraksi Tavily. Mendukung hingga 20 URL per permintaan dengan peringkat ulang berbasis kueri opsional untuk fokus pada potongan konten yang relevan. Dua mode ekstraksi: dasar untuk ekstraksi teks cepat, lanjutan untuk halaman yang dirender JavaScript dan data terstruktur. Otentikasi OAuth otomatis melalui browser pada saat pertama kali dijalankan, atau konfigurasi kunci API manual di pengaturan. Mengembalikan format markdown atau teks biasa dengan URL gambar opsional dan batas waktu yang dapat dikonfigurasi hingga 60 detik.
official
research
tavily-ai
We need to translate the given English text into Bahasa Indonesia. The instruction says to preserve product names, protocol names, URLs, numbers, and technical terms. The name "research" is to be preserved if it appears in the source text, but we are not to include the name unless it appears. The source text does not contain the word "research" as a standalone name? Actually it starts with "Comprehensive research on any topic..." so "research" is part of the text. But the instruction says "Do not include the name unless it appears in the source text." So we keep it as is. Also preserve "Tavily MCP server", "OAuth", etc. Translate the rest naturally. Let me translate: "Comprehensive research on any topic with automatic source gathering, analysis, and citations." -> "Riset komprehensif tentang topik apa pun dengan pengumpulan sumber, analisis, dan kutipan otomatis." "Conducts multi-source web research with explicit citations, ideal for comparisons, current events, market analysis, and detailed reports
official
search
tavily-ai
Pencarian web dengan hasil yang dioptimalkan untuk LLM, penilaian relevansi, dan penyaringan fleksibel. Mendukung empat mode kedalaman pencarian (ultra-cepat, cepat, dasar, lanjutan) dengan pengaturan latensi dan tradeoff relevansi yang dapat dikonfigurasi. Termasuk penyaringan domain, batasan rentang waktu, rentang tanggal, penguatan negara, dan ekstraksi konten mentah. Mengembalikan hasil dengan judul, URL, cuplikan konten, dan skor relevansi; hasil gambar opsional dan favicon. Otentikasi OAuth otomatis melalui server Tavily MCP atau konfigurasi kunci API;...
official
tavily-cli
tavily-ai
Pencarian web, ekstraksi konten, perayapan situs, dan riset mendalam melalui Tavily CLI. Lima mode perintah yang mencakup pencarian, ekstraksi, penemuan URL, perayapan massal, dan riset multi-sumber dengan kutipan. Semua perintah mendukung output JSON dan penyimpanan file untuk alur kerja terstruktur dan agen. Pola eskalasi memandu Anda dari pencarian sederhana melalui ekstraksi, pemetaan, perayapan, hingga riset komprehensif berdasarkan kebutuhan Anda. Memerlukan instalasi tavily-cli dan autentikasi kunci API melalui tvly login.
official
tavily-crawl
tavily-ai
Perayap situs web multi-halaman dengan penyaringan semantik dan ekspor markdown. Jelajahi seluruh bagian situs dengan kontrol kedalaman dan luas; filter berdasarkan regex jalur, domain, atau instruksi bahasa alami untuk memfokuskan hasil. Simpan setiap halaman sebagai file markdown lokal melalui --output-dir, atau kembalikan JSON terstruktur untuk pemrosesan agen. Gunakan instruksi semantik dengan ekstraksi potongan untuk mencegah pembengkakan konteks saat memberikan hasil ke LLM; gunakan ekstraksi halaman penuh untuk unduhan dokumentasi offline. Mendukung...
official
tavily-dynamic-search
tavily-ai
Cari web, filter hasil, dan ekstrak konten sehingga data pencarian mentah tidak pernah masuk ke jendela konteks Anda. Hanya keluaran print() yang telah dikurasi yang akan kembali.
official
tavily-extract
tavily-ai
Mengekstrak markdown atau teks bersih dari hingga 20 URL, dengan dukungan rendering JavaScript dan pemotongan berbasis kueri. Menangani halaman yang dirender JavaScript dengan kedalaman ekstraksi yang dapat dikonfigurasi (dasar untuk halaman sederhana, lanjutan untuk SPA dinamis dan tabel). Mendukung ekstraksi berbasis kueri untuk mengembalikan hanya potongan konten yang relevan, bukan halaman penuh. Mengembalikan markdown yang dioptimalkan untuk LLM secara default, dengan opsi format teks biasa dan output JSON terstruktur. Memproses hingga 20 URL dalam satu panggilan;...
official