Scrapezy MCP Server

oficial

Convierte sitios web en conjuntos de datos con Scrapezy

Documentación

@scrapezy/mcp Servidor MCP

Scrapezy MCP server

smithery badge

Un servidor del Protocolo de Contexto de Modelo para Scrapezy que permite a los modelos de IA extraer datos estructurados de sitios web.

Características

Herramientas

  • extract_structured_data - Extraer datos estructurados de un sitio web
    • Toma la URL y la instrucción como parámetros obligatorios
    • Devuelve datos estructurados extraídos del sitio web según la instrucción
    • La instrucción debe describir claramente qué datos extraer del sitio web

Instalación

Instalación mediante Smithery

Para instalar el Servidor MCP de Scrapezy para Claude Desktop automáticamente a través de Smithery:

npx -y @smithery/cli install @Scrapezy/mcp --client claude

Instalación manual

npm install -g @scrapezy/mcp

Uso

Configuración de la clave API

Hay dos formas de proporcionar tu clave API de Scrapezy:

  1. Variable de entorno:

    export SCRAPEZY_API_KEY=your_api_key
    npx @scrapezy/mcp
    
  2. Argumento de línea de comandos:

    npx @scrapezy/mcp --api-key=your_api_key
    

Para usar con Claude Desktop, añade la configuración del servidor:

En MacOS: ~/Library/Application Support/Claude/claude_desktop_config.json En Windows: %APPDATA%/Claude/claude_desktop_config.json

{
  "mcpServers": {
    "scrapezy": {
      "command": "npx @scrapezy/mcp --api-key=your_api_key"
    }
  }
}

Ejemplo de uso en Claude

Puedes usar esta herramienta en Claude con instrucciones como:

Please extract product information from this page: https://example.com/product
Extract the product name, price, description, and available colors.

Claude usará el servidor MCP para extraer los datos estructurados solicitados del sitio web.

Depuración

Dado que los servidores MCP se comunican a través de stdio, la depuración puede ser complicada. Recomendamos usar el Inspector MCP, que está disponible como un script del paquete:

npm run inspector

El Inspector proporcionará una URL para acceder a las herramientas de depuración en tu navegador.

Licencia

MIT