Oxylabs MCP Server

chính thức

Scrape các trang web với Oxylabs Web API, hỗ trợ kết xuất động và phân tích để trích xuất dữ liệu có cấu trúc.

Tài liệu

Oxylabs + MCP

Máy chủ Oxylabs MCP

Cầu nối còn thiếu giữa các mô hình AI và web thực tế: một API duy nhất cung cấp dữ liệu sạch, có cấu trúc từ bất kỳ trang web nào.


📖 Tổng quan

Máy chủ Oxylabs MCP cung cấp cầu nối giữa các mô hình AI và web. Nó cho phép chúng thu thập dữ liệu từ bất kỳ URL nào, hiển thị các trang sử dụng nhiều JavaScript, trích xuất và định dạng nội dung cho mục đích AI, quản lý CAPTCHA và truy cập dữ liệu web bị giới hạn địa lý từ hơn 195 quốc gia.

🛠️ Công cụ MCP

Oxylabs MCP cung cấp hai bộ công cụ có thể được sử dụng cùng nhau hoặc độc lập:

Công cụ API Trình thu thập dữ liệu Web Oxylabs

  1. universal_scraper: Sử dụng API Trình thu thập dữ liệu Web Oxylabs để thu thập dữ liệu trang web nói chung;
  2. google_search_scraper: Sử dụng API Trình thu thập dữ liệu Web Oxylabs để trích xuất kết quả từ Tìm kiếm Google;
  3. amazon_search_scraper: Sử dụng API Trình thu thập dữ liệu Web Oxylabs để thu thập dữ liệu các trang kết quả tìm kiếm Amazon;
  4. amazon_product_scraper: Sử dụng API Trình thu thập dữ liệu Web Oxylabs để trích xuất dữ liệu từ các trang sản phẩm riêng lẻ trên Amazon.

Công cụ AI Studio của Oxylabs

  1. ai_scraper: Thu thập nội dung từ bất kỳ URL nào ở định dạng JSON hoặc Markdown với khả năng trích xuất dữ liệu được hỗ trợ bởi AI;
  2. ai_crawler: Dựa trên một lời nhắc, thu thập dữ liệu từ một trang web và thu thập dữ liệu ở định dạng Markdown hoặc JSON trên nhiều trang;
  3. ai_browser_agent: Dựa trên lời nhắc, điều khiển một trình duyệt và trả về dữ liệu ở định dạng Markdown, JSON, HTML hoặc ảnh chụp màn hình;
  4. ai_search: Tìm kiếm trên web các URL và nội dung của chúng với khả năng trích xuất nội dung được hỗ trợ bởi AI.

✅ Điều kiện tiên quyết

Trước khi bắt đầu, hãy đảm bảo bạn có ít nhất một trong những điều sau:

  • Tài khoản API Trình thu thập dữ liệu Web Oxylabs: Lấy tên người dùng và mật khẩu từ Oxylabs (có bản dùng thử miễn phí 1 tuần);
  • Khóa API AI Studio của Oxylabs: Lấy khóa API từ Oxylabs AI Studio. (1000 tín dụng miễn phí).

📦 Cấu hình

Biến môi trường

Máy chủ Oxylabs MCP hỗ trợ các biến môi trường sau:

TênMô tảMặc định
OXYLABS_USERNAMETên người dùng API Trình thu thập dữ liệu Web Oxylabs của bạn
OXYLABS_PASSWORDMật khẩu API Trình thu thập dữ liệu Web Oxylabs của bạn
OXYLABS_AI_STUDIO_API_KEYKhóa API AI Studio của Oxylabs của bạn
LOG_LEVELMức ghi nhật ký cho các nhật ký trả về cho máy kháchINFO

Dựa trên thông tin xác thực được cung cấp, máy chủ sẽ tự động hiển thị các công cụ tương ứng:

  • Nếu chỉ cung cấp OXYLABS_USERNAMEOXYLABS_PASSWORD, máy chủ sẽ hiển thị các công cụ API Trình thu thập dữ liệu Web;
  • Nếu chỉ cung cấp OXYLABS_AI_STUDIO_API_KEY, máy chủ sẽ hiển thị các công cụ AI Studio;
  • Nếu cung cấp cả OXYLABS_USERNAMEOXYLABS_PASSWORDOXYLABS_AI_STUDIO_API_KEY, máy chủ sẽ hiển thị tất cả các công cụ.

❗❗❗ Lưu ý quan trọng: nếu bạn không có thông tin xác thực API Trình thu thập dữ liệu Web hoặc AI Studio của Oxylabs, hãy xóa các phần giữ chỗ biến môi trường tương ứng. Việc để lại các giá trị giữ chỗ sẽ dẫn đến các công cụ được hiển thị nhưng không hoạt động.

Cấu hình với uvx

  • Cài đặt trình quản lý gói uvx:
    # macOS and Linux
    curl -LsSf https://astral.sh/uv/install.sh | sh
    
    HOẶC:
    # Windows
    powershell -ExecutionPolicy ByPass -c "irm https://astral.sh/uv/install.ps1 | iex"
    
  • Sử dụng cấu hình sau:
    {
      "mcpServers": {
        "oxylabs": {
          "command": "uvx",
          "args": ["oxylabs-mcp"],
          "env": {
            "OXYLABS_USERNAME": "OXYLABS_USERNAME",
            "OXYLABS_PASSWORD": "OXYLABS_PASSWORD",
            "OXYLABS_AI_STUDIO_API_KEY": "OXYLABS_AI_STUDIO_API_KEY"
          }
        }
      }
    }
    

Cấu hình với uv

  • Cài đặt trình quản lý gói uv:

    # macOS and Linux
    curl -LsSf https://astral.sh/uv/install.sh | sh
    

    HOẶC:

    # Windows
    powershell -ExecutionPolicy ByPass -c "irm https://astral.sh/uv/install.ps1 | iex"
    
  • Sử dụng cấu hình sau:

    {
      "mcpServers": {
        "oxylabs": {
          "command": "uv",
          "args": [
            "--directory",
            "/<Absolute-path-to-folder>/oxylabs-mcp",
            "run",
            "oxylabs-mcp"
          ],
          "env": {
            "OXYLABS_USERNAME": "OXYLABS_USERNAME",
            "OXYLABS_PASSWORD": "OXYLABS_PASSWORD",
            "OXYLABS_AI_STUDIO_API_KEY": "OXYLABS_AI_STUDIO_API_KEY"
          }
        }
      }
    }
    

Cấu hình với Smithery Oauth2

  {
    "mcpServers": {
      "oxylabs": {
        "url": "https://server.smithery.ai/@oxylabs/oxylabs-mcp/mcp"
      }
    }
  }
  • Làm theo hướng dẫn để xác thực Oxylabs MCP với luồng Oauth2

Cấu hình với tham số truy vấn Smithery

Trong trường hợp máy khách của bạn không hỗ trợ xác thực Oauth2, bạn có thể truyền trực tiếp các tham số xác thực Oxylabs trong url

  {
    "mcpServers": {
      "oxylabs": {
        "url": "https://server.smithery.ai/@oxylabs/oxylabs-mcp/mcp?oxylabsUsername=OXYLABS_USERNAME&oxylabsPassword=OXYLABS_PASSWORD&oxylabsAiStudioApiKey=OXYLABS_AI_STUDIO_API_KEY"
      }
    }
  }

Thiết lập thủ công với Claude Desktop

Điều hướng đến Claude → Cài đặt → Nhà phát triển → Chỉnh sửa Cấu hình và thêm một trong các cấu hình trên vào tệp claude_desktop_config.json.

Thiết lập thủ công với Cursor AI

Điều hướng đến Cursor → Cài đặt → Cài đặt Cursor → MCP. Nhấp vào Thêm máy chủ MCP toàn cục mới và thêm một trong các cấu hình trên.

📝 Ghi nhật ký

Máy chủ cung cấp thông tin bổ sung về các lệnh gọi công cụ trong các sự kiện notification/message

{
  "method": "notifications/message",
  "params": {
    "level": "info",
    "data": "Create job with params: {\"url\": \"https://ip.oxylabs.io\"}"
  }
}
{
  "method": "notifications/message",
  "params": {
    "level": "info",
    "data": "Job info: job_id=7333113830223918081 job_status=done"
  }
}
{
  "method": "notifications/message",
  "params": {
    "level": "error",
    "data": "Error: request to Oxylabs API failed"
  }
}

🛡️ Giấy phép

Được phân phối theo Giấy phép MIT – xem LICENSE để biết chi tiết.


Về Oxylabs

Được thành lập vào năm 2015, Oxylabs là nền tảng thu thập thông tin tình báo web hàng đầu thị trường, được thúc đẩy bởi các tiêu chuẩn cao nhất về kinh doanh, đạo đức và tuân thủ, cho phép các công ty trên toàn thế giới khai thác thông tin chi tiết dựa trên dữ liệu.

image

Được tạo ra với ☕ bởi Oxylabs. Hãy thoải mái tặng chúng tôi một ⭐ nếu MCP đã tiết kiệm cho bạn một ngày cuối tuần.

✨ Các tính năng chính

Thu thập nội dung từ bất kỳ trang web nào
  • Trích xuất dữ liệu từ bất kỳ URL nào, bao gồm các ứng dụng một trang phức tạp
  • Hiển thị đầy đủ các trang web động bằng cách sử dụng hỗ trợ trình duyệt không giao diện
  • Chọn hiển thị JavaScript đầy đủ, chỉ HTML hoặc không hiển thị
  • Mô phỏng các khung nhìn Di động và Máy tính để bàn để hiển thị chân thực
Tự động nhận dữ liệu sẵn sàng cho AI
  • Tự động làm sạch và chuyển đổi HTML sang Markdown để cải thiện khả năng đọc
  • Sử dụng các trình phân tích cú pháp tự động cho các mục tiêu phổ biến như Google, Amazon, v.v.
Quản lý CAPTCHA & hạn chế địa lý
  • Điều hướng các hệ thống quản lý yêu cầu tự động tinh vi với tỷ lệ thành công cao
  • Thu thập dữ liệu đáng tin cậy ngay cả những trang web phức tạp nhất
  • Nhận IP tự động luân chuyển từ nhóm proxy bao phủ hơn 195 quốc gia
Thiết lập linh hoạt & hỗ trợ đa nền tảng
  • Đặt các tùy chọn hiển thị và phân tích cú pháp nếu cần
  • Đưa dữ liệu trực tiếp vào các mô hình AI hoặc công cụ phân tích
  • Hoạt động trên macOS, Windows và Linux
Xử lý lỗi và quản lý yêu cầu tích hợp sẵn
  • Xử lý và báo cáo lỗi toàn diện
  • Giới hạn tốc độ thông minh và quản lý yêu cầu

Tại sao chọn Oxylabs MCP?  🕸️ ➜ 📦 ➜ 🤖

Hãy tưởng tượng bạn bảo LLM của mình "Tóm tắt cuộc thảo luận mới nhất trên Hacker News về GPT‑5" – và nó chỉ đơn giản trả lời. MCP (Multi‑Client Proxy) thực hiện điều đó bằng cách làm những phần nhàm chán cho bạn:

Oxylabs MCP làm gìTại sao nó quan trọng với bạn
Quản lý các bức tường yêu cầu tự động với mạng proxy toàn cầu OxylabsCho phép truy cập trang web và ẩn danh
Hiển thị JavaScript trong Chrome không giao diệnỨng dụng một trang, đã được xử lý
Làm sạch HTML → JSONĐưa thẳng vào cơ sở dữ liệu vector hoặc lời nhắc
Trình phân tích cú pháp có cấu trúc tùy chọn (Google, Amazon, v.v.)Truy cập một dòng đến các mục tiêu phổ biến

mcp-name: io.oxylabs/oxylabs-mcp