Bright Data MCP Server
官方发现、提取并与网络交互——一个接口驱动对公共互联网的自动化访问。
文档
The Web MCP
🌐 为你的 AI 赋予实时网络超能力
无缝连接大语言模型与实时网络,且不会被屏蔽
快速开始 • 功能特性 • 定价 • 演示 • 文档 • 支持
🎉 免费套餐可用! 🎉
每月 5,000 积分免费
无需信用卡 · 每月自动续期 · 非常适合原型设计和日常 AI 工作流
新功能:代码工具组 - 你的编程智能体的最佳伙伴
直接从你的 AI 智能体即时访问 npm 和 PyPI 包数据。
需要包的最新版本?想在不离开工作流的情况下阅读其 README?
代码 工具组按需为编程智能体提供结构化、可靠的包元数据——
无需抓取,没有过时的缓存,只有你的智能体做出明智依赖决策所需的数据。
| npm 包版本、README、元数据和依赖项 | PyPI Python 包信息、版本和项目详情 |
GROUPS="code" · Claude Code、Cursor、Windsurf 及任何 MCP 驱动的编程智能体的首选工具
GEO 与 AI 品牌可见性工具
了解 ChatGPT、Grok 和 Perplexity 如何谈论你的品牌。
直接从你的智能体查询领先的大语言模型,并获取结构化、Markdown 格式的答案。
这是生成式引擎优化 (GEO) 的终极反馈循环——监控 AI 生成的
推荐,跟踪跨大语言模型的品牌提及,并了解 AI 如何看待你的产品。
| ChatGPT AI 生成的洞察、引用和推荐 | Grok 由 X 数据驱动的实时 AI 分析 | Perplexity 带来源的搜索增强型 AI 答案 |
GROUPS="geo" · 适用于任何 MCP 兼容的智能体
🌟 概述
The Web MCP 是你为 AI 助手赋予真正网络能力的门户。不再有过时的回复,不再有“我无法访问实时信息”——只有无缝、可靠且真正有效的网络访问。
由全球排名第一的网络数据平台 Bright Data 构建,此 MCP 服务器确保你的 AI 永远不会被屏蔽、限速或遇到验证码。
| ✅ 适用于任何大语言模型 Claude、GPT、Gemini、Llama | 🛡️ 永不被屏蔽 企业级反屏蔽 | 🚀 5,000 免费积分 每月 · 无需信用卡 | ⚡ 零配置 开箱即用 |
🎯 适用场景
- 🔍 实时研究 - 获取当前价格、新闻和实时数据
- 🛍️ 电商情报 - 监控产品、价格和库存
- 📊 市场分析 - 追踪竞争对手和行业趋势
- 🤖 AI 智能体 - 构建能够真正浏览网页的智能体
- 💻 编程智能体 - 实时查询 npm/PyPI 包、版本和 README
- 🧠 GEO 与品牌可见性 - 了解 ChatGPT、Grok 和 Perplexity 如何看待你的品牌
- 📝 内容创作 - 获取最新信息用于写作
- 🎓 学术研究 - 高效地从多个来源收集数据
⚡ 快速开始
使用配置向导:
非常适合希望零设置的用户。只需将此 URL 添加到你的 MCP 客户端:
https://mcp.brightdata.com/mcp?token=YOUR_API_TOKEN_HERE
在 Claude Desktop 中设置:
- 前往:设置 → 连接器 → 添加自定义连接器
- 名称:
Bright Data Web - URL:
https://mcp.brightdata.com/mcp?token=YOUR_API_TOKEN - 点击“添加”,完成!✨
{
"mcpServers": {
"Bright Data": {
"command": "npx",
"args": ["@brightdata/mcp"],
"env": {
"API_TOKEN": "<your-api-token-here>"
}
}
}
}
🚀 定价与模式
| ⚡ 快速模式(免费套餐) | 💎 专业模式 | 🔧 自定义模式 |
|---|---|---|
$0/月5,000 积分 ✅ 网页搜索 默认模式
|
按需付费快速模式的所有功能外加 60+ 工具 ✅ 浏览器控制 |
基于用量选择你需要的工具 ✅ 组合工具组 GROUPS="browser"TOOLS="scrape_as_html"
|
💡 免费套餐如何运作: 你的账户每月获得 5,000 积分 (价值约 $7.50),每月 1 日自动续期,无需信用卡。 MCP 请求从此共享池中扣除——基础工具(
search_engine、scrape_as_markdown、discover)每次请求消耗 1 积分,而web_data_*工具每条返回记录消耗 1 积分。未使用的积分 不会结转,用完后请求将停止(除非你已存入资金,否则不会产生意外费用)。专业模式不包含在 免费套餐中,会根据使用情况产生额外费用。
🧠 高级工具选择
GROUPS允许你启用精选的工具包。使用逗号分隔的组 ID,例如ecommerce,browser。TOOLS在所选组的基础上添加明确的工具名称。- 模式优先级:
PRO_MODE=true(所有工具)→GROUPS/TOOLS(白名单)→ 默认快速模式(基础工具包)。 - 始终启用的基础工具:
search_engine、search_engine_batch、scrape_as_markdown、scrape_batch、discover。 - 组 ID
custom是保留的;使用TOOLS进行自定义选择。
| 组 ID | 描述 | 特色工具 |
|---|---|---|
ecommerce | 零售和市场数据集 | web_data_amazon_product、
web_data_walmart_product、
web_data_google_shopping |
social | 社交、社区和创作者洞察 | web_data_linkedin_posts、
web_data_tiktok_posts、
web_data_youtube_videos |
browser | Bright Data Scraping Browser 自动化工具 | scraping_browser_snapshot、
scraping_browser_click_ref、
scraping_browser_screenshot |
finance | 金融情报数据集 | web_data_yahoo_finance_business |
business | 公司和位置情报数据集 | web_data_crunchbase_company、
web_data_zoominfo_company_profile、
web_data_zillow_properties_listing |
research | 新闻和开发者数据源 | web_data_github_repository_file、
web_data_reuter_news |
app_stores | 应用商店数据 | web_data_google_play_store、
web_data_apple_app_store |
travel | 旅行信息 | web_data_booking_hotel_listings |
geo | GEO 与大语言模型品牌可见性 | web_data_chatgpt_ai_insights、
web_data_grok_ai_insights、
web_data_perplexity_ai_insights |
code | 面向编程智能体的包情报 | web_data_npm_package、
web_data_pypi_package |
advanced_scraping | 批量和 AI 辅助提取助手 | search_engine_batch、
scrape_batch、
extract |
Claude Desktop 示例
{
"mcpServers": {
"Bright Data": {
"command": "npx",
"args": ["@brightdata/mcp"],
"env": {
"API_TOKEN": "<your-api-token-here>",
"GROUPS": "browser,advanced_scraping",
"TOOLS": "extract"
}
}
}
}
编程智能体示例(Claude Code / Cursor / Windsurf)
为你的编程智能体提供实时包情报——来自 npm 和 PyPI 的最新版本、README、 依赖项和元数据,无需抓取:
{
"mcpServers": {
"Bright Data": {
"command": "npx",
"args": ["@brightdata/mcp"],
"env": {
"API_TOKEN": "<your-api-token-here>",
"GROUPS": "code"
}
}
}
}
✨ 功能特性
🔥 核心能力
| 🔍 智能网页搜索 为 AI 优化的 Google 质量结果 | 📄 干净的 Markdown AI 就绪的内容提取 |
| 🌍 全球访问 自动绕过地理限制 | 🛡️ 反机器人保护 永不被屏蔽或限速 |
| 🤖 浏览器自动化 远程控制真实浏览器(专业版) | ⚡ 闪电般快速 针对最小延迟优化 |
🎯 直接有效的查询示例
✅ "What's Tesla's current stock price?"
✅ "Find the best-rated restaurants in Tokyo right now"
✅ "Get today's weather forecast for New York"
✅ "What movies are releasing this week?"
✅ "What are the trending topics on Twitter today?"
✅ "What's the latest version of express on npm?"
✅ "Get the README for the langchain-brightdata PyPI package"
🎬 演示
注意: 这些视频展示的是早期版本。新演示即将推出!🎥
查看演示视频
基本网页搜索演示
https://github.com/user-attachments/assets/59f6ebba-801a-49ab-8278-1b2120912e33
高级抓取演示
https://github.com/user-attachments/assets/61ab0bee-fdfa-4d50-b0de-5fab96b4b91d
🔧 可用工具
⚡ 快速模式工具(默认 - 免费)
| 工具 | 描述 | 用例 |
|---|---|---|
🔍 search_engine | 带有 AI 优化结果的网页搜索 | 研究、事实核查、时事 |
📄 scrape_as_markdown | 将任何网页转换为干净的 Markdown | 内容提取、文档 |
🎯 discover | 带有基于意图的相关性评分的 AI 排序网页搜索 | 深度研究、RAG 管道、竞争分析 |
💎 专业模式工具(60+ 工具)
点击查看所有专业工具
| 类别 | 工具 | 描述 |
|---|---|---|
| 浏览器控制 | scraping_browser.* | 完整的浏览器自动化 |
| 网络数据 API | web_data_* | 结构化数据提取 |
| 电子商务 | 产品抓取器 | Amazon、eBay、Walmart 数据 |
| 社交媒体 | 社交抓取器 | Twitter、LinkedIn、Instagram |
| 地图与本地 | 位置工具 | Google Maps、商业数据 |
🎮 立即试用!
🧪 在线游乐场
无需任何设置即可试用 Web MCP:
🔧 配置
基本设置
{
"mcpServers": {
"Bright Data": {
"command": "npx",
"args": ["@brightdata/mcp"],
"env": {
"API_TOKEN": "your-token-here"
}
}
}
}
高级配置
{
"mcpServers": {
"Bright Data": {
"command": "npx",
"args": ["@brightdata/mcp"],
"env": {
"API_TOKEN": "your-token-here",
"PRO_MODE": "true", // Enable all 60+ tools
"RATE_LIMIT": "100/1h", // Custom rate limiting
"WEB_UNLOCKER_ZONE": "custom", // Custom unlocker zone
"BROWSER_ZONE": "custom_browser", // Custom browser zone
"POLLING_TIMEOUT": "600" // Polling timeout in seconds (default: 600)
}
}
}
}
环境变量
| 变量 | 描述 | 默认值 | 示例 |
|---|---|---|---|
API_TOKEN | 你的 Bright Data API 令牌(必需) | - | your-token-here |
PRO_MODE | 启用所有 60+ 工具 | false | true |
RATE_LIMIT | 自定义速率限制 | 无限制 | 100/1h、50/30m |
WEB_UNLOCKER_ZONE | 自定义 Web Unlocker 区域名称 | mcp_unlocker | my_custom_zone |
BROWSER_ZONE | 自定义浏览器区域名称 | mcp_browser | my_browser_zone |
POLLING_TIMEOUT | web_data_* 工具轮询超时(秒) | 600 | 300、1200 |
BASE_TIMEOUT | 基础工具请求超时(秒)(搜索和抓取) | 无限制 | 60、120 |
BASE_MAX_RETRIES | 基础工具在瞬时错误时的最大重试次数 (0-3) | 0 | 1、3 |
GROUPS | 逗号分隔的工具组 ID | - | ecommerce,browser |
TOOLS | 逗号分隔的单个工具名称 | - | extract,scrape_as_html |
注意:
POLLING_TIMEOUT控制 web_data_* 工具等待结果的时间。每秒 = 1 次轮询尝试。- 较低的值(例如 300)将在数据收集较慢时更快失败。
- 较高的值(例如 1200)允许更复杂的抓取任务有更多时间。
📚 文档
🚨 常见问题与解决方案
🔧 故障排除指南
❌ “spawn npx ENOENT” 错误
解决方案: 安装 Node.js 或使用 node 的完整路径:
"command": "/usr/local/bin/node" // macOS/Linux
"command": "C:\\Program Files\\nodejs\\node.exe" // Windows
⏱️ 复杂网站超时
解决方案: 在客户端设置中将超时增加到 180 秒
🔑 身份验证问题
解决方案: 确保你的 API 令牌有效且具有适当权限
📡 远程服务器连接
解决方案: 检查你的互联网连接和防火墙设置
🤝 贡献
我们欢迎贡献!你可以通过以下方式提供帮助:
请遵循 Bright Data 的编码标准。
📞 支持
📜 许可证
MIT © Bright Data Ltd.