Scrapezy MCP Server
chính thứcBiến các trang web thành tập dữ liệu với Scrapezy
Tài liệu
@scrapezy/mcp Máy chủ MCP
Một máy chủ Giao thức Ngữ cảnh Mô hình dành cho Scrapezy cho phép các mô hình AI trích xuất dữ liệu có cấu trúc từ các trang web.
Tính năng
Công cụ
extract_structured_data- Trích xuất dữ liệu có cấu trúc từ một trang web- Nhận URL và prompt làm tham số bắt buộc
- Trả về dữ liệu có cấu trúc được trích xuất từ trang web dựa trên prompt
- Prompt nên mô tả rõ ràng dữ liệu nào cần trích xuất từ trang web
Cài đặt
Cài đặt qua Smithery
Để cài đặt Máy chủ MCP Scrapezy cho Claude Desktop tự động qua Smithery:
npx -y @smithery/cli install @Scrapezy/mcp --client claude
Cài đặt thủ công
npm install -g @scrapezy/mcp
Cách sử dụng
Thiết lập Khóa API
Có hai cách để cung cấp khóa API Scrapezy của bạn:
-
Biến môi trường:
export SCRAPEZY_API_KEY=your_api_key npx @scrapezy/mcp -
Tham số dòng lệnh:
npx @scrapezy/mcp --api-key=your_api_key
Để sử dụng với Claude Desktop, hãy thêm cấu hình máy chủ:
Trên MacOS: ~/Library/Application Support/Claude/claude_desktop_config.json
Trên Windows: %APPDATA%/Claude/claude_desktop_config.json
{
"mcpServers": {
"scrapezy": {
"command": "npx @scrapezy/mcp --api-key=your_api_key"
}
}
}
Ví dụ sử dụng trong Claude
Bạn có thể sử dụng công cụ này trong Claude với các prompt như:
Please extract product information from this page: https://example.com/product
Extract the product name, price, description, and available colors.
Claude sẽ sử dụng máy chủ MCP để trích xuất dữ liệu có cấu trúc được yêu cầu từ trang web.
Gỡ lỗi
Vì các máy chủ MCP giao tiếp qua stdio, việc gỡ lỗi có thể gặp khó khăn. Chúng tôi khuyên bạn nên sử dụng MCP Inspector, có sẵn dưới dạng tập lệnh gói:
npm run inspector
Inspector sẽ cung cấp một URL để truy cập các công cụ gỡ lỗi trong trình duyệt của bạn.
Giấy phép
MIT