Oxylabs MCP Server
chính thứcScrape các trang web với Oxylabs Web API, hỗ trợ kết xuất động và phân tích để trích xuất dữ liệu có cấu trúc.
Tài liệu
Máy chủ Oxylabs MCP
Cầu nối còn thiếu giữa các mô hình AI và web thực tế: một API duy nhất cung cấp dữ liệu sạch, có cấu trúc từ bất kỳ trang web nào.
📖 Tổng quan
Máy chủ Oxylabs MCP cung cấp cầu nối giữa các mô hình AI và web. Nó cho phép chúng thu thập dữ liệu từ bất kỳ URL nào, hiển thị các trang sử dụng nhiều JavaScript, trích xuất và định dạng nội dung cho mục đích AI, quản lý CAPTCHA và truy cập dữ liệu web bị giới hạn địa lý từ hơn 195 quốc gia.
🛠️ Công cụ MCP
Oxylabs MCP cung cấp hai bộ công cụ có thể được sử dụng cùng nhau hoặc độc lập:
Công cụ API Trình thu thập dữ liệu Web Oxylabs
- universal_scraper: Sử dụng API Trình thu thập dữ liệu Web Oxylabs để thu thập dữ liệu trang web nói chung;
- google_search_scraper: Sử dụng API Trình thu thập dữ liệu Web Oxylabs để trích xuất kết quả từ Tìm kiếm Google;
- amazon_search_scraper: Sử dụng API Trình thu thập dữ liệu Web Oxylabs để thu thập dữ liệu các trang kết quả tìm kiếm Amazon;
- amazon_product_scraper: Sử dụng API Trình thu thập dữ liệu Web Oxylabs để trích xuất dữ liệu từ các trang sản phẩm riêng lẻ trên Amazon.
Công cụ AI Studio của Oxylabs
- ai_scraper: Thu thập nội dung từ bất kỳ URL nào ở định dạng JSON hoặc Markdown với khả năng trích xuất dữ liệu được hỗ trợ bởi AI;
- ai_crawler: Dựa trên một lời nhắc, thu thập dữ liệu từ một trang web và thu thập dữ liệu ở định dạng Markdown hoặc JSON trên nhiều trang;
- ai_browser_agent: Dựa trên lời nhắc, điều khiển một trình duyệt và trả về dữ liệu ở định dạng Markdown, JSON, HTML hoặc ảnh chụp màn hình;
- ai_search: Tìm kiếm trên web các URL và nội dung của chúng với khả năng trích xuất nội dung được hỗ trợ bởi AI.
✅ Điều kiện tiên quyết
Trước khi bắt đầu, hãy đảm bảo bạn có ít nhất một trong những điều sau:
- Tài khoản API Trình thu thập dữ liệu Web Oxylabs: Lấy tên người dùng và mật khẩu từ Oxylabs (có bản dùng thử miễn phí 1 tuần);
- Khóa API AI Studio của Oxylabs: Lấy khóa API từ Oxylabs AI Studio. (1000 tín dụng miễn phí).
📦 Cấu hình
Biến môi trường
Máy chủ Oxylabs MCP hỗ trợ các biến môi trường sau:
| Tên | Mô tả | Mặc định |
|---|---|---|
OXYLABS_USERNAME | Tên người dùng API Trình thu thập dữ liệu Web Oxylabs của bạn | |
OXYLABS_PASSWORD | Mật khẩu API Trình thu thập dữ liệu Web Oxylabs của bạn | |
OXYLABS_AI_STUDIO_API_KEY | Khóa API AI Studio của Oxylabs của bạn | |
LOG_LEVEL | Mức ghi nhật ký cho các nhật ký trả về cho máy khách | INFO |
Dựa trên thông tin xác thực được cung cấp, máy chủ sẽ tự động hiển thị các công cụ tương ứng:
- Nếu chỉ cung cấp
OXYLABS_USERNAMEvàOXYLABS_PASSWORD, máy chủ sẽ hiển thị các công cụ API Trình thu thập dữ liệu Web; - Nếu chỉ cung cấp
OXYLABS_AI_STUDIO_API_KEY, máy chủ sẽ hiển thị các công cụ AI Studio; - Nếu cung cấp cả
OXYLABS_USERNAMEvàOXYLABS_PASSWORDvàOXYLABS_AI_STUDIO_API_KEY, máy chủ sẽ hiển thị tất cả các công cụ.
❗❗❗ Lưu ý quan trọng: nếu bạn không có thông tin xác thực API Trình thu thập dữ liệu Web hoặc AI Studio của Oxylabs, hãy xóa các phần giữ chỗ biến môi trường tương ứng. Việc để lại các giá trị giữ chỗ sẽ dẫn đến các công cụ được hiển thị nhưng không hoạt động.
Cấu hình với uvx
- Cài đặt trình quản lý gói uvx:
HOẶC:# macOS and Linux curl -LsSf https://astral.sh/uv/install.sh | sh# Windows powershell -ExecutionPolicy ByPass -c "irm https://astral.sh/uv/install.ps1 | iex" - Sử dụng cấu hình sau:
{ "mcpServers": { "oxylabs": { "command": "uvx", "args": ["oxylabs-mcp"], "env": { "OXYLABS_USERNAME": "OXYLABS_USERNAME", "OXYLABS_PASSWORD": "OXYLABS_PASSWORD", "OXYLABS_AI_STUDIO_API_KEY": "OXYLABS_AI_STUDIO_API_KEY" } } } }
Cấu hình với uv
-
Cài đặt trình quản lý gói uv:
# macOS and Linux curl -LsSf https://astral.sh/uv/install.sh | shHOẶC:
# Windows powershell -ExecutionPolicy ByPass -c "irm https://astral.sh/uv/install.ps1 | iex" -
Sử dụng cấu hình sau:
{ "mcpServers": { "oxylabs": { "command": "uv", "args": [ "--directory", "/<Absolute-path-to-folder>/oxylabs-mcp", "run", "oxylabs-mcp" ], "env": { "OXYLABS_USERNAME": "OXYLABS_USERNAME", "OXYLABS_PASSWORD": "OXYLABS_PASSWORD", "OXYLABS_AI_STUDIO_API_KEY": "OXYLABS_AI_STUDIO_API_KEY" } } } }
Cấu hình với Smithery Oauth2
- Đi tới https://smithery.ai/server/@oxylabs/oxylabs-mcp;
- Nhấp vào Tự động để cài đặt cấu hình Oxylabs MCP cho máy khách tương ứng;
- HOẶC sử dụng cấu hình sau:
{
"mcpServers": {
"oxylabs": {
"url": "https://server.smithery.ai/@oxylabs/oxylabs-mcp/mcp"
}
}
}
- Làm theo hướng dẫn để xác thực Oxylabs MCP với luồng Oauth2
Cấu hình với tham số truy vấn Smithery
Trong trường hợp máy khách của bạn không hỗ trợ xác thực Oauth2, bạn có thể truyền trực tiếp các tham số xác thực Oxylabs trong url
{
"mcpServers": {
"oxylabs": {
"url": "https://server.smithery.ai/@oxylabs/oxylabs-mcp/mcp?oxylabsUsername=OXYLABS_USERNAME&oxylabsPassword=OXYLABS_PASSWORD&oxylabsAiStudioApiKey=OXYLABS_AI_STUDIO_API_KEY"
}
}
}
Thiết lập thủ công với Claude Desktop
Điều hướng đến Claude → Cài đặt → Nhà phát triển → Chỉnh sửa Cấu hình và thêm một trong các cấu hình trên vào tệp claude_desktop_config.json.
Thiết lập thủ công với Cursor AI
Điều hướng đến Cursor → Cài đặt → Cài đặt Cursor → MCP. Nhấp vào Thêm máy chủ MCP toàn cục mới và thêm một trong các cấu hình trên.
📝 Ghi nhật ký
Máy chủ cung cấp thông tin bổ sung về các lệnh gọi công cụ trong các sự kiện notification/message
{
"method": "notifications/message",
"params": {
"level": "info",
"data": "Create job with params: {\"url\": \"https://ip.oxylabs.io\"}"
}
}
{
"method": "notifications/message",
"params": {
"level": "info",
"data": "Job info: job_id=7333113830223918081 job_status=done"
}
}
{
"method": "notifications/message",
"params": {
"level": "error",
"data": "Error: request to Oxylabs API failed"
}
}
🛡️ Giấy phép
Được phân phối theo Giấy phép MIT – xem LICENSE để biết chi tiết.
Về Oxylabs
Được thành lập vào năm 2015, Oxylabs là nền tảng thu thập thông tin tình báo web hàng đầu thị trường, được thúc đẩy bởi các tiêu chuẩn cao nhất về kinh doanh, đạo đức và tuân thủ, cho phép các công ty trên toàn thế giới khai thác thông tin chi tiết dựa trên dữ liệu.
✨ Các tính năng chính
Thu thập nội dung từ bất kỳ trang web nào
- Trích xuất dữ liệu từ bất kỳ URL nào, bao gồm các ứng dụng một trang phức tạp
- Hiển thị đầy đủ các trang web động bằng cách sử dụng hỗ trợ trình duyệt không giao diện
- Chọn hiển thị JavaScript đầy đủ, chỉ HTML hoặc không hiển thị
- Mô phỏng các khung nhìn Di động và Máy tính để bàn để hiển thị chân thực
Tự động nhận dữ liệu sẵn sàng cho AI
- Tự động làm sạch và chuyển đổi HTML sang Markdown để cải thiện khả năng đọc
- Sử dụng các trình phân tích cú pháp tự động cho các mục tiêu phổ biến như Google, Amazon, v.v.
Quản lý CAPTCHA & hạn chế địa lý
- Điều hướng các hệ thống quản lý yêu cầu tự động tinh vi với tỷ lệ thành công cao
- Thu thập dữ liệu đáng tin cậy ngay cả những trang web phức tạp nhất
- Nhận IP tự động luân chuyển từ nhóm proxy bao phủ hơn 195 quốc gia
Thiết lập linh hoạt & hỗ trợ đa nền tảng
- Đặt các tùy chọn hiển thị và phân tích cú pháp nếu cần
- Đưa dữ liệu trực tiếp vào các mô hình AI hoặc công cụ phân tích
- Hoạt động trên macOS, Windows và Linux
Xử lý lỗi và quản lý yêu cầu tích hợp sẵn
- Xử lý và báo cáo lỗi toàn diện
- Giới hạn tốc độ thông minh và quản lý yêu cầu
Tại sao chọn Oxylabs MCP? 🕸️ ➜ 📦 ➜ 🤖
Hãy tưởng tượng bạn bảo LLM của mình "Tóm tắt cuộc thảo luận mới nhất trên Hacker News về GPT‑5" – và nó chỉ đơn giản trả lời. MCP (Multi‑Client Proxy) thực hiện điều đó bằng cách làm những phần nhàm chán cho bạn:
| Oxylabs MCP làm gì | Tại sao nó quan trọng với bạn |
|---|---|
| Quản lý các bức tường yêu cầu tự động với mạng proxy toàn cầu Oxylabs | Cho phép truy cập trang web và ẩn danh |
| Hiển thị JavaScript trong Chrome không giao diện | Ứng dụng một trang, đã được xử lý |
| Làm sạch HTML → JSON | Đưa thẳng vào cơ sở dữ liệu vector hoặc lời nhắc |
| Trình phân tích cú pháp có cấu trúc tùy chọn (Google, Amazon, v.v.) | Truy cập một dòng đến các mục tiêu phổ biến |
mcp-name: io.oxylabs/oxylabs-mcp
