tavily-best-practices

โดย tavily-ai

Web search API สำหรับ LLMs ที่เข้าถึงข้อมูลแบบเรียลไทม์ ดึงเนื้อหา ค้นหาเว็บไซต์ และวิจัยด้วย AI มีห้าวิธีหลัก: search() สำหรับผลลัพธ์เว็บ, extract() สำหรับเนื้อหา URL, crawl() สำหรับดึงข้อมูลทั้งเว็บไซต์, map() สำหรับค้นหา URL, และ research() สำหรับสังเคราะห์ AI แบบครบวงจร รองรับ Python และ JavaScript SDK พร้อม async clients สำหรับการค้นหาแบบขนานและปรับความลึกการค้นหาได้ (ultra-fast/fast/basic/advanced) วิธี crawl รองรับคำสั่งเชิงความหมายเพื่อโฟกัสการดึงข้อมูลที่...

npx skills add https://github.com/tavily-ai/skills --skill tavily-best-practices

Tavily

Tavily is a search API designed for LLMs, enabling AI applications to access real-time web data.

Installation

Python:

pip install tavily-python

JavaScript:

npm install @tavily/core

See references/sdk.md for complete SDK reference.

Client Initialization

from tavily import TavilyClient

# Uses TAVILY_API_KEY env var (recommended)
client = TavilyClient()

#With project tracking (for usage organization)
client = TavilyClient(project_id="your-project-id")

# Async client for parallel queries
from tavily import AsyncTavilyClient
async_client = AsyncTavilyClient()

Choosing the Right Method

For custom agents/workflows:

NeedMethod
Web search resultssearch()
Content from specific URLsextract()
Content from entire sitecrawl()
URL discovery from sitemap()

For out-of-the-box research:

NeedMethod
End-to-end research with AI synthesisresearch()

Quick Reference

search() - Web Search

response = client.search(
    query="quantum computing breakthroughs",  # Keep under 400 chars
    max_results=10,
    search_depth="advanced"
)
print(response)

Key parameters: query, max_results, search_depth (ultra-fast/fast/basic/advanced), include_domains, exclude_domains, time_range

See references/search.md for complete search reference.

extract() - URL Content Extraction

# Simple one-step extraction
response = client.extract(
    urls=["https://docs.example.com"],
    extract_depth="advanced"
)
print(response)

Key parameters: urls (max 20), extract_depth, query, chunks_per_source (1-5)

See references/extract.md for complete extract reference.

crawl() - Site-Wide Extraction

response = client.crawl(
    url="https://docs.example.com",
    instructions="Find API documentation pages",  # Semantic focus
    extract_depth="advanced"
)
print(response)

Key parameters: url, max_depth, max_breadth, limit, instructions, chunks_per_source, select_paths, exclude_paths

See references/crawl.md for complete crawl reference.

map() - URL Discovery

response = client.map(
    url="https://docs.example.com"
)
print(response)

research() - AI-Powered Research

import time

# For comprehensive multi-topic research
result = client.research(
    input="Analyze competitive landscape for X in SMB market",
    model="pro"  # or "mini" for focused queries, "auto" when unsure
)
request_id = result["request_id"]

# Poll until completed
response = client.get_research(request_id)
while response["status"] not in ["completed", "failed"]:
    time.sleep(10)
    response = client.get_research(request_id)

print(response["content"])  # The research report

Key parameters: input, model ("mini"/"pro"/"auto"), stream, output_schema, citation_format

See references/research.md for complete research reference.

Detailed Guides

For complete parameters, response fields, patterns, and examples:

Skills เพิ่มเติมจาก tavily-ai

crawl
tavily-ai
แยกและบันทึกเนื้อหาเว็บไซต์เป็นไฟล์ markdown เพื่อการเข้าถึงและวิเคราะห์แบบออฟไลน์ รองรับการกำหนดความลึกในการรวบรวมข้อมูล (1-5 ระดับ) ขีดจำกัดความกว้าง และขีดจำกัดหน้าเพื่อปรับสมดุลระหว่างความครอบคลุมและประสิทธิภาพ รวมถึงการกรองเส้นทางด้วยรูปแบบ regex เพื่อเน้นส่วนที่ต้องการและแยกเนื้อหาที่ไม่เกี่ยวข้อง มีสองโหมด: การแยกเนื้อหาทั้งหน้าเพื่อรวบรวมข้อมูล หรือการแบ่งส่วนเชิงความหมายพร้อมคำสั่งภาษาธรรมชาติเพื่อป้อนผลลัพธ์เข้าสู่บริบทของ LLM มี API แผนที่เสริมสำหรับ URL...
official
extract
tavily-ai
แยกเนื้อหาที่สะอาดจาก URL ที่ระบุโดยใช้ API การสกัดของ Tavily รองรับสูงสุด 20 URL ต่อคำขอ พร้อมการจัดลำดับใหม่ตามคำค้นหาเพื่อเน้นเนื้อหาที่เกี่ยวข้อง โหมดการสกัดสองแบบ: พื้นฐานสำหรับการสกัดข้อความที่รวดเร็ว ขั้นสูงสำหรับหน้าที่เรนเดอร์ด้วย JavaScript และข้อมูลที่มีโครงสร้าง การตรวจสอบสิทธิ์ OAuth อัตโนมัติผ่านเบราว์เซอร์ในครั้งแรกที่ใช้งาน หรือกำหนดค่า API key ด้วยตนเองในการตั้งค่า ส่งคืนรูปแบบ markdown หรือข้อความธรรมดาพร้อม URL รูปภาพที่ไม่บังคับ และกำหนดเวลาหมดอายุได้สูงสุด 60 วินาที
official
research
tavily-ai
การวิจัยเชิงลึกในทุกหัวข้อ พร้อมการรวบรวมแหล่งข้อมูล วิเคราะห์ และอ้างอิงโดยอัตโนมัติ ดำเนินการวิจัยทางเว็บจากหลายแหล่งพร้อมการอ้างอิงที่ชัดเจน เหมาะสำหรับการเปรียบเทียบ เหตุการณ์ปัจจุบัน การวิเคราะห์ตลาด และรายงานโดยละเอียด มีสามตัวเลือกโมเดล: mini สำหรับการวิจัยหัวข้อเดียวแบบเจาะจง (~30 วินาที), pro สำหรับการวิเคราะห์หลายมุมแบบครอบคลุม (~60-120 วินาที) และ auto สำหรับการตรวจจับความซับซ้อนผ่าน API ยืนยันตัวตนผ่าน OAuth ผ่านเซิร์ฟเวอร์ Tavily MCP พร้อมการเข้าสู่ระบบผ่านเบราว์เซอร์อัตโนมัติบน...
official
search
tavily-ai
ค้นหาเว็บด้วยผลลัพธ์ที่ปรับให้เหมาะสมกับ LLM การให้คะแนนความเกี่ยวข้อง และการกรองที่ยืดหยุ่น รองรับโหมดความลึกในการค้นหาสี่โหมด (เร็วพิเศษ เร็ว พื้นฐาน ขั้นสูง) พร้อมการปรับแต่งความหน่วงและความเกี่ยวข้องที่กำหนดค่าได้ รวมถึงการกรองโดเมน ข้อจำกัดช่วงเวลา ช่วงวันที่ การเพิ่มน้ำหนักประเทศ และการดึงเนื้อหาดิบ ส่งคืนผลลัพธ์พร้อมชื่อเรื่อง URL ตัวอย่างเนื้อหา และคะแนนความเกี่ยวข้อง ผลลัพธ์รูปภาพและ favicon แบบเลือกได้ การรับรองความถูกต้อง OAuth อัตโนมัติผ่านเซิร์ฟเวอร์ Tavily MCP หรือการกำหนดค่าคีย์ API...
official
tavily-cli
tavily-ai
การค้นหาเว็บ การดึงเนื้อหา การรวบรวมข้อมูลเว็บไซต์ และการวิจัยเชิงลึกผ่าน Tavily CLI มีโหมดคำสั่งห้าโหมดครอบคลุมการค้นหา การดึงข้อมูล การค้นพบ URL การรวบรวมข้อมูลจำนวนมาก และการวิจัยหลายแหล่งพร้อมการอ้างอิง คำสั่งทั้งหมดรองรับเอาต์พุต JSON และการบันทึกไฟล์สำหรับเวิร์กโฟลว์แบบมีโครงสร้างและแบบเอเจนต์ รูปแบบการเพิ่มระดับจะแนะนำคุณจากการค้นหาอย่างง่ายผ่านการดึงข้อมูล การทำแผนที่ การรวบรวมข้อมูล ไปจนถึงการวิจัยที่ครอบคลุมตามความต้องการของคุณ ต้องติดตั้ง tavily-cli และการตรวจสอบสิทธิ์คีย์ API ผ่าน tvly login
official
tavily-crawl
tavily-ai
โปรแกรมรวบรวมข้อมูลเว็บไซต์หลายหน้าที่มีการกรองเชิงความหมายและส่งออกเป็นมาร์กดาวน์ เรียกดูส่วนต่างๆ ของไซต์ทั้งหมดพร้อมควบคุมความลึกและความกว้าง กรองตาม regex ของเส้นทาง โดเมน หรือคำสั่งภาษาธรรมชาติเพื่อเน้นผลลัพธ์ บันทึกแต่ละหน้าเป็นไฟล์มาร์กดาวน์ในเครื่องผ่าน --output-dir หรือส่งคืน JSON ที่มีโครงสร้างสำหรับการประมวลผลแบบเอเจนต์ ใช้คำสั่งเชิงความหมายพร้อมการแยกส่วนเพื่อป้องกันการขยายบริบทเมื่อป้อนผลลัพธ์ให้กับ LLM ใช้การแยกทั้งหน้าสำหรับการดาวน์โหลดเอกสารออฟไลน์ รองรับ...
official
tavily-dynamic-search
tavily-ai
ค้นหาเว็บ กรองผลลัพธ์ และดึงเนื้อหา เพื่อให้ข้อมูลการค้นหาดิบไม่เข้าสู่หน้าต่างบริบทของคุณ มีเพียงผลลัพธ์ print() ที่คุณจัดเตรียมไว้เท่านั้นที่จะถูกส่งกลับมา
official
tavily-extract
tavily-ai
แยกข้อมูลเป็น markdown หรือข้อความที่สะอาดจาก URL สูงสุด 20 รายการ พร้อมรองรับการเรนเดอร์ JavaScript และการแบ่งส่วนตามคำค้นหา จัดการหน้าเว็บที่เรนเดอร์ด้วย JavaScript ได้ โดยปรับระดับการแยกข้อมูลได้ (พื้นฐานสำหรับหน้าเว็บธรรมดา ขั้นสูงสำหรับ SPA และตารางแบบไดนามิก) รองรับการแยกข้อมูลตามคำค้นหาเพื่อส่งคืนเฉพาะเนื้อหาที่เกี่ยวข้อง แทนที่จะส่งคืนทั้งหน้า ส่งคืน markdown ที่ปรับให้เหมาะสมกับ LLM โดยค่าเริ่มต้น พร้อมตัวเลือกรูปแบบข้อความธรรมดาและเอาต์พุต JSON แบบมีโครงสร้าง ประมวลผล URL สูงสุด 20 รายการในการเรียกครั้งเดียว...
official