Scrapezy MCP Server

chính thức

Biến các trang web thành tập dữ liệu với Scrapezy

Tài liệu

@scrapezy/mcp Máy chủ MCP

Scrapezy MCP server

smithery badge

Một máy chủ Giao thức Ngữ cảnh Mô hình dành cho Scrapezy cho phép các mô hình AI trích xuất dữ liệu có cấu trúc từ các trang web.

Tính năng

Công cụ

  • extract_structured_data - Trích xuất dữ liệu có cấu trúc từ một trang web
    • Nhận URL và prompt làm tham số bắt buộc
    • Trả về dữ liệu có cấu trúc được trích xuất từ trang web dựa trên prompt
    • Prompt nên mô tả rõ ràng dữ liệu nào cần trích xuất từ trang web

Cài đặt

Cài đặt qua Smithery

Để cài đặt Máy chủ MCP Scrapezy cho Claude Desktop tự động qua Smithery:

npx -y @smithery/cli install @Scrapezy/mcp --client claude

Cài đặt thủ công

npm install -g @scrapezy/mcp

Cách sử dụng

Thiết lập Khóa API

Có hai cách để cung cấp khóa API Scrapezy của bạn:

  1. Biến môi trường:

    export SCRAPEZY_API_KEY=your_api_key
    npx @scrapezy/mcp
    
  2. Tham số dòng lệnh:

    npx @scrapezy/mcp --api-key=your_api_key
    

Để sử dụng với Claude Desktop, hãy thêm cấu hình máy chủ:

Trên MacOS: ~/Library/Application Support/Claude/claude_desktop_config.json Trên Windows: %APPDATA%/Claude/claude_desktop_config.json

{
  "mcpServers": {
    "scrapezy": {
      "command": "npx @scrapezy/mcp --api-key=your_api_key"
    }
  }
}

Ví dụ sử dụng trong Claude

Bạn có thể sử dụng công cụ này trong Claude với các prompt như:

Please extract product information from this page: https://example.com/product
Extract the product name, price, description, and available colors.

Claude sẽ sử dụng máy chủ MCP để trích xuất dữ liệu có cấu trúc được yêu cầu từ trang web.

Gỡ lỗi

Vì các máy chủ MCP giao tiếp qua stdio, việc gỡ lỗi có thể gặp khó khăn. Chúng tôi khuyên bạn nên sử dụng MCP Inspector, có sẵn dưới dạng tập lệnh gói:

npm run inspector

Inspector sẽ cung cấp một URL để truy cập các công cụ gỡ lỗi trong trình duyệt của bạn.

Giấy phép

MIT