coreclaw webscraper MCP Server

Truy xuất dữ liệu có cấu trúc thông qua hội thoại ngôn ngữ tự nhiên

Tài liệu

跳转到内容

CoreClaw MCP 服务

Copy for LLMs

CoreClaw MCP 服务通过 Model Context Protocol (MCP) 暴露 CoreClaw OpenAPI v2 的公开工作流。连接后,AI Agent 可以发现 CoreClaw Worker、查看输入 schema、运行 Worker 或已保存任务、查询运行状态、读取日志,并导出结构化结果。

架构


用户对话 -> AI Agent -> MCP 协议 -> CoreClaw MCP 服务 -> CoreClaw OpenAPI v2

                              HTTP       mcp.coreclaw.com      openapi.coreclaw.com


托管的 Streamable HTTP 入口是:


https://mcp.coreclaw.com/mcp


优先使用托管入口。仅在开发、调试或客户端只支持本地 stdio 时,才需要本地运行 coreclaw-mcp-server

前提条件

  • CoreClaw 账户。如果还没有账户,请先 注册。
  • CoreClaw API 密钥,可在 控制台 -> 设置 -> API & 集成 获取。
  • 支持 MCP 的客户端。参见下方 支持的平台。

快速开始

在 MCP 客户端中添加以下配置:


{

  "mcpServers": {

    "coreclaw": {

      "url": "https://mcp.coreclaw.com/mcp",

      "headers": {

        "api-key": "YOUR_CORECLAW_API_KEY"

      }

    }

  }

}


保存配置后,如果客户端要求重启或重新加载,请完成对应操作。之后 AI Agent 就可以在对话中调用 CoreClaw 工具。

认证方式

托管 MCP 服务支持以下任一请求头:

  • api-key: YOUR_CORECLAW_API_KEY
  • X-API-Key: YOUR_CORECLAW_API_KEY
  • Authorization: Bearer YOUR_CORECLAW_API_KEY

MCP 服务会把认证信息转发给 CoreClaw OpenAPI v2,上游请求统一使用 Authorization: Bearer <token>

不要把 API 密钥提交到版本控制系统。客户端支持安全凭据存储时,请优先使用该能力。

可用工具

CoreClaw MCP 服务公开 28 个 OpenAPI v2 工具。Worker 版本创建/更新接口和 Worker internal 详情接口属于内部接口,不会通过 MCP 暴露。

发现与预检查

工具说明对应 API
list_proxy_regions查询代理地区代码和名称GET /api/v2/proxy/region
list_store_workers搜索公开 Store WorkerGET /api/v2/store
list_workers列出当前账户拥有的 WorkerGET /api/v2/workers
get_worker获取 Worker 元数据、版本、README 和参数信息GET /api/v2/workers/{workerId}
get_worker_input_schema获取 Worker 公开输入 schemaGET /api/v2/workers/{workerId}/input-schema
list_worker_tasks列出当前账户保存的 Worker 任务GET /api/v2/worker-tasks
get_account_info查询账户余额、流量额度和过期时间GET /api/v2/users/account

执行

工具说明对应 API
run_worker使用临时 JSON 输入运行 WorkerPOST /api/v2/workers/{workerId}/runs
run_worker_task运行已保存的 Worker 任务POST /api/v2/worker-tasks/{workerTaskId}/runs

运行查询

工具说明对应 API
list_worker_runs查询运行历史GET /api/v2/worker-runs
get_last_worker_run查询当前账户最近一次运行GET /api/v2/worker-runs/last
get_worker_run通过 run_id 查询指定运行GET /api/v2/worker-runs/{runId}
get_worker_last_run查询指定 Worker 最近一次运行GET /api/v2/workers/{workerId}/runs/last

结果、导出和日志

工具说明对应 API
list_last_worker_run_results查看当前账户最近一次运行结果GET /api/v2/worker-runs/last/result
export_last_worker_run_results导出当前账户最近一次运行结果GET /api/v2/worker-runs/last/export
get_last_worker_run_log查看当前账户最近一次运行日志GET /api/v2/worker-runs/last/log
list_worker_run_results查看指定运行结果GET /api/v2/worker-runs/{runId}/result
export_worker_run_results导出指定运行结果GET /api/v2/worker-runs/{runId}/result/export
get_worker_run_log查看指定运行日志GET /api/v2/worker-runs/{runId}/log
list_worker_last_run_results查看指定 Worker 最近一次运行结果GET /api/v2/workers/{workerId}/runs/last/result
export_worker_last_run_results导出指定 Worker 最近一次运行结果GET /api/v2/workers/{workerId}/runs/last/export
get_worker_last_run_log查看指定 Worker 最近一次运行日志GET /api/v2/workers/{workerId}/runs/last/log

重跑和控制

工具说明对应 API
rerun_last_worker_run重跑当前账户最近一次运行POST /api/v2/worker-runs/last/rerun
rerun_worker_run重跑指定运行POST /api/v2/worker-runs/{runId}/rerun
rerun_worker_last_run重跑指定 Worker 最近一次运行POST /api/v2/workers/{workerId}/runs/last/rerun
abort_last_worker_run停止当前账户最近一次活跃运行POST /api/v2/worker-runs/last/abort
abort_worker_run停止指定活跃运行POST /api/v2/worker-runs/{runId}/abort
abort_worker_last_run停止指定 Worker 最近一次活跃运行POST /api/v2/workers/{workerId}/runs/last/abort

典型工作流

临时运行一个 Worker 时,通常按这个顺序调用:


list_store_workers(keyword)

  -> get_worker_input_schema(worker_id)

    -> run_worker(worker_id, input_json, is_async=true)

      -> get_worker_run(run_id)

        -> list_worker_run_results(run_id) 或 export_worker_run_results(run_id)


运行已保存任务时,使用:


list_worker_tasks(worker_id)

  -> run_worker_task(worker_task_id, is_async=true)

    -> get_worker_run(run_id)

      -> list_worker_run_results(run_id)


如果 Worker 输入 schema 需要代理地区,先调用 list_proxy_regions。只有在用户明确要求重试或重复运行时才使用 rerun_* 工具;只有在用户明确要求停止运行时才使用 abort_* 工具。

Worker 输入

调用 run_worker 时,把业务字段放在 input_json 中:


{

  "worker_id": "YOUR_WORKER_ID",

  "version": "latest",

  "input_json": "{\"keyword\":\"coffee\",\"limit\":10}",

  "is_async": true

}


MCP 服务会把 input_json 包装为 CoreClaw 使用的 input.parameters.custom。高级调用方可以通过 raw_input_json 直接传完整 CoreClaw input 对象,但不能同时传 input_jsonraw_input_json

支持的平台

平台配置方式指南
Claude DesktopStreamable HTTP配置指南
Claude CLIStreamable HTTP配置指南
Codex DesktopStreamable HTTP配置指南
CursorStreamable HTTP配置指南
ChatGPTStreamable HTTP配置指南
VS CodeStreamable HTTP配置指南
WindsurfStreamable HTTP配置指南
ClineStreamable HTTP配置指南
n8nStreamable HTTP配置指南
通用 HTTP任意 Streamable HTTP MCP 客户端或 REST 风格工具调用方配置指南

REST 兼容端点

除了标准 MCP 端点 /mcp,服务还提供 REST 兼容入口 /mcp/<tool_name>,适合偏好按工具发起 HTTP 请求的平台:


curl -X POST https://mcp.coreclaw.com/mcp/list_store_workers \

  -H "Content-Type: application/json" \

  -H "api-key: YOUR_CORECLAW_API_KEY" \

  -d '{"keyword":"amazon","offset":0,"limit":5}'


更多 JSON-RPC 和 REST 示例见 通用 HTTP 客户端。

故障排除

现象可能原因处理方式
Invalid API key密钥缺失、错误或已过期在控制台 -> 设置 -> API & 集成中验证密钥
Worker does not exist (50001)worker_id 错误使用 list_store_workers 或 list_workers 获取返回的 slug/path
工具没有出现客户端没有加载 Streamable HTTP MCP 配置重启客户端并检查 MCP 配置路径
运行已启动但没有结果行运行仍在进行或已经失败轮询 get_worker_run;失败时调用 get_worker_run_log
代理地区被拒绝代理地区代码无效调用 list_proxy_regions 并使用返回的地区代码

限制说明

  • 托管服务使用 Streamable HTTP。只支持本地 stdio 的客户端需要本地运行 coreclaw-mcp-server
  • 认证基于 API key;托管入口不需要 OAuth。
  • 内部接口不会通过 MCP 暴露,包括 Worker 版本创建/更新和 Worker internal 详情。

下一步

  • 配置 Claude Desktop
  • 配置 Codex Desktop
  • 配置通用 HTTP
  • 阅读 CoreClaw API 文档