apify-ecommerce

bởi apify

Thu thập dữ liệu thương mại điện tử về giá cả, đánh giá, sản phẩm bán chạy và khám phá người bán trên hơn 30 nền tảng bao gồm Amazon, Walmart, eBay, Shopify, WooCommerce, và…

npx skills add https://github.com/apify/awesome-skills --skill apify-ecommerce

E-Commerce Cluster

Answer natural language e-commerce questions by routing to the right Apify Actor and delivering a synthesized answer via the apify CLI.

CLI rules: Always pass --user-agent apify-awesome-skills/apify-ecommerce, --json (or the relevant --format flag on datasets get-items), and 2>/dev/null. The --user-agent flag is critical for telemetry — never omit it.

Prerequisites

(No need to check it upfront)

  • Apify CLI v1.5.0+ (npm install -g apify-cli)
  • jq (recommended for quick extraction and filtering; brew install jq on macOS, apt install jq on Linux)
  • Authentication via one of:

Verify auth: apify info --user-agent apify-awesome-skills/apify-ecommerce — should show username and userId.

Workflow

Copy this checklist and track progress:

Task Progress:
- [ ] Step 1: Detect intent and select Actor
- [ ] Step 2: Fetch Actor schema
- [ ] Step 3: Ask user preferences (format, result count)
- [ ] Step 4: Run the Actor and fetch results
- [ ] Step 5: Analyze results and deliver synthesized answer

Step 1: Detect Intent and Select Actor

Classify the user's message into an intent, then pick the right Actor.

Intent signals:

Signals in user messageIntent
price, cost, cheapest, compare prices, pricingpricing
review, rating, sentiment, stars, feedbackreviews
bestseller, top selling, most popular, trendingbestsellers
seller, vendor, reseller, who sellssellers
all products from, scrape store, full catalogstore-scrape
what platform, built on, tech stack, Shopify or WooCommercetech-stack
SEO, listing quality, product page auditseo-audit
competitor funnel, competitor pricing, conversion elementscompetitor
search intent, keyword intent, SERP intentsearch-intent
match products, same product on different platformsproduct-matching
restaurant, food delivery, DoorDash, UberEats, TheForkfood-delivery
enrich store, store metadata, store liststore-enrichment
event, concert, ticket, Eventbriteevents
property, real estate, house listing, Realtorreal-estate
Facebook ads, Meta ads, ad library, competitor adsads-intelligence
classified, Craigslist, used item for saleclassifieds
car, used car, vehicle, automotive, Webmotorsautomotive
pins, inspiration, Pinterest boards, visual search, Pinterest trendscontent-discovery
TikTok Shop, TikTok store, TikTok creatortiktok-shop
website for sale, domain for sale, Flippawebsite-marketplace

If multiple intents are detected, ask: "Do you want [intent A] or [intent B]?"

Actor routing table — always try Primary first, switch to Fallback only if it fails or returns 0 results:

IntentPlatformPrimary ActorFallback Actor
pricingAmazon / Walmart / genericapify/e-commerce-scraping-tool
pricingeBayapify/e-commerce-scraping-toolivanvs/ebay-scraper-pay-per-result
pricingEtsyapify/e-commerce-scraping-toolepctex/etsy-scraper
pricingGoogle Shoppingapify/e-commerce-scraping-toolepctex/google-shopping-scraper
pricingFacebook Marketplaceapify/e-commerce-scraping-toolapify/facebook-marketplace-scraper
pricingSHEINapify/e-commerce-scraping-toolseamless_coffer/shein-product-scraper
pricingLazadaapify/e-commerce-scraping-toolfatihtahta/lazada-scraper
pricingCanadian Tireapify/e-commerce-scraping-toolazzouzana/canadiantire-ca-scraper
pricingTescoapify/e-commerce-scraping-toolradeance/tesco-scraper
pricingShopifyapify/e-commerce-scraping-tooltrovevault/shopify-products-scraper
pricingWooCommerceapify/e-commerce-scraping-tooltrovevault/woocommerce-products-scraper
reviewsAmazon / Walmart / genericapify/e-commerce-scraping-tooljunglee/amazon-reviews-scraper
reviewsTrustpilotapify/e-commerce-scraping-toolcasper11515/trustpilot-reviews-scraper
reviewsTheForkapify/e-commerce-scraping-tooljdtpnjtp/thefork-restaurant-scraper-advanced
bestsellersAmazonapify/e-commerce-scraping-tooljunglee/amazon-bestsellers
sellersAmazonapify/e-commerce-scraping-tooljunglee/amazon-seller-scraper
sellerseBayapify/e-commerce-scraping-toolivanvs/ebay-scraper-pay-per-result
store-scrapeShopifyapify/e-commerce-scraping-tooltrovevault/shopify-products-scraper
store-scrapeWooCommerceapify/e-commerce-scraping-tooltrovevault/woocommerce-products-scraper
store-scrapeAmazonapify/e-commerce-scraping-tooljunglee/Amazon-crawler
store-scrapeFlippaapify/e-commerce-scraping-toolscraped/flippa-scraper
tech-stackanyapify/e-commerce-scraping-tooltrovevault/e-commerce-tech-stack-detector
seo-auditanyapify/e-commerce-scraping-tooltrovevault/product-listing-seo-auditor
competitoranyapify/e-commerce-scraping-tooltrovevault/competitor-intelligence-scraper---funnel-pricing-conversion
search-intentanyapify/e-commerce-scraping-tooltrovevault/ai-serp-intent-extractor---search-intent-classifier
product-matchinganyapify/e-commerce-scraping-tooltri_angle/product-matching-vectorizer
store-enrichmentanyapify/e-commerce-scraping-tooltrovevault/e-commerce-store-data-enricher
food-deliveryDoorDashapify/e-commerce-scraping-tooltri_angle/doordash-store-details-scraper
food-deliveryUberEatsapify/e-commerce-scraping-toole-commerce/ubereats-reviews-scraper
food-deliveryTheForkapify/e-commerce-scraping-tooljdtpnjtp/thefork-restaurant-scraper-advanced
ads-intelligenceFacebook / Metaapify/e-commerce-scraping-toolapify/facebook-ads-scraper
classifiedsCraigslistapify/e-commerce-scraping-toolivanvs/craigslist-scraper-pay-per-result
automotiveWebmotorsapify/e-commerce-scraping-toolstealth_mode/webmotors-auto-search-scraper
eventsEventbriteapify/e-commerce-scraping-toolaitorsm/eventbrite
real-estateRealtor.comapify/e-commerce-scraping-toolpowerai/realtor-properties-search-scraper
content-discoveryPinterestapify/e-commerce-scraping-toolfatihtahta/pinterest-scraper-search
tiktok-shopTikTok Shopapify/e-commerce-scraping-toollemur/tiktok-shop-creators
website-marketplaceFlippaapify/e-commerce-scraping-toolscraped/flippa-scraper

Step 2: Fetch Actor Schema

Fetch the Actor summary, input schema, and README:

# Summary (title, description, pricing, stats)
apify actors info "ACTOR_ID" --user-agent apify-awesome-skills/apify-ecommerce --json 2>/dev/null

# Input schema (required and optional parameters; schema lives in
# .taggedBuilds.latest.build.inputSchema as an escaped JSON string)
apify actors info "ACTOR_ID" --user-agent apify-awesome-skills/apify-ecommerce --input --json 2>/dev/null

# README (capabilities, examples, gotchas)
apify actors info "ACTOR_ID" --user-agent apify-awesome-skills/apify-ecommerce --readme 2>/dev/null

Replace ACTOR_ID with the selected Actor (e.g., apify/e-commerce-scraping-tool).

Step 3: Ask User Preferences

Before running, ask:

  1. Output format:
    • Quick answer (default) — synthesized answer in chat, no file saved
    • CSV — full export saved to disk
    • JSON — full export saved to disk
  2. Result count — suggest defaults by intent:
IntentDefault
pricing50 products
reviews200 reviews
bestsellers100 items
sellers50 sellers
store-scrapeall (unlimited)
food-delivery50 restaurants
all others20–50

Cost safety: Always set a sensible result limit in the Actor input (e.g., maxResults, resultsLimit, maxCrawledPages, or equivalent field from the input schema). Default to the per-intent values above unless the user explicitly asks for more. Warn the user before running large scrapes (1000+ results) as they consume more Apify credits.

Step 4: Run the Actor and Fetch Results

Two steps: run the Actor (blocks until done), then fetch dataset items in the requested format.

Run the Actor — returns run metadata as JSON; extract defaultDatasetId for the next step:

apify actors call "ACTOR_ID" -i 'JSON_INPUT' \
  --user-agent apify-awesome-skills/apify-ecommerce --json 2>/dev/null

From the output use .id (run ID), .status (should be SUCCEEDED), and .defaultDatasetId.

Fetch results — pick the variant based on the user's preference:

# Quick answer: total count + fields + top 5 in chat (no file)
apify datasets info DATASET_ID --json \
  --user-agent apify-awesome-skills/apify-ecommerce 2>/dev/null \
  | jq '{itemCount, fields, consoleUrl}'
apify datasets get-items DATASET_ID --limit 5 \
  --user-agent apify-awesome-skills/apify-ecommerce --format json 2>/dev/null

# CSV file
apify datasets get-items DATASET_ID \
  --user-agent apify-awesome-skills/apify-ecommerce --format csv 2>/dev/null > YYYY-MM-DD_OUTPUT_FILE.csv

# JSON file
apify datasets get-items DATASET_ID \
  --user-agent apify-awesome-skills/apify-ecommerce --format json 2>/dev/null > YYYY-MM-DD_OUTPUT_FILE.json

Other --format options: jsonl, xlsx, xml, rss, html. Use --offset N to paginate large datasets.

Tip: for anything more than a quick peek, save the dataset to a local file first (with > file.json / > file.csv) and run further analysis from disk. apify datasets get-items always streams over the network, so piping it straight into jq re-downloads the whole thing every iteration.

Combining with jq for quick extraction:

Treat jq as a complement to apify datasets get-items, not a replacement: server-side --limit / --offset / --format keeps cost and bandwidth down. Use jq on a sample item or on a file you already saved.

# Discover real field names from one sample item (Actor outputs vary —
# use this before composing further jq queries)
apify datasets get-items DATASET_ID --limit 1 --format json \
  --user-agent apify-awesome-skills/apify-ecommerce 2>/dev/null \
  | jq '.[0]'

# Quick aggregation from a JSON file you already saved with the commands above
jq '[.[] | select(.rating != null and .rating >= 4.5)] | length' YYYY-MM-DD_OUTPUT_FILE.json

Step 5: Analyze Results and Deliver Answer

After the run completes, deliver a direct synthesized answer — not a data dump:

  • Pricing: price range, average, top 5 cheapest with URLs
  • Reviews: average rating, top 3 positive and negative themes, recent snippets
  • Bestsellers: top 10 by rank with name, price, rating, URL
  • Sellers: total sellers, price range per seller, unauthorized seller flags
  • Store-scrape: total products, category breakdown, price range, stock summary
  • Tech-stack: platform detected, confidence level, notable plugins
  • Food delivery: restaurant count, average rating, price tier breakdown
  • Ads intelligence: total ads, active/inactive split, top creative formats

Error Handling

  • Auth error → run apify login, or set APIFY_TOKEN env var
  • Actor not found → check Actor ID spelling in the routing table
  • Run status FAILED → open the console URL (.consoleUrl from run metadata) for logs
  • Timeout / very long run → pass --timeout <seconds> to apify actors call
  • No results → broaden the keyword or switch to a Fallback Actor from the routing table
  • proxy is required → add "proxy": {"useApifyProxy": true} to the Actor input
  • Platform not detected → default to apify/e-commerce-scraping-tool with generic intent

Thêm skills từ apify

bug-triage
apify
Phân loại các vấn đề lỗi đang mở trên apify/apify-mcp-server. Phân tích, soạn phản hồi, xin phê duyệt, đăng tải.
official
dig
apify
Kỹ năng linh hoạt để khám phá, lập kế hoạch và xác định thông số công việc trên máy chủ Apify MCP. KHÔNG chỉnh sửa tệp nguồn — kỹ năng này chỉ dành cho việc hiểu và lập kế hoạch.
official
apify-actor-development
apify
Tạo, gỡ lỗi và triển khai các chương trình đám mây không máy chủ để thu thập dữ liệu web, tự động hóa và xử lý dữ liệu. Hỗ trợ các mẫu JavaScript, TypeScript và Python với các thư viện Crawlee, Playwright và Cheerio tích hợp cho việc thu thập dữ liệu qua HTTP và trình duyệt. Bao gồm kiểm thử cục bộ qua apify run với bộ nhớ cách ly, xác thực lược đồ cho đầu vào/đầu ra và triển khai lên nền tảng Apify qua apify push. Yêu cầu xác thực Apify CLI và siêu dữ liệu generatedBy bắt buộc trong .actor/actor.json cho AI...
official
apify-actorization
apify
Chuyển đổi các dự án hiện có thành Apify Actors không máy chủ với tích hợp SDK theo ngôn ngữ cụ thể. Hỗ trợ JavaScript/TypeScript (với Actor.init() / Actor.exit()), Python (trình quản lý ngữ cảnh bất đồng bộ) và bất kỳ ngôn ngữ nào thông qua trình bao bọc CLI. Cung cấp quy trình làm việc có cấu trúc: apify init để tạo khung, áp dụng bao bọc SDK, cấu hình lược đồ đầu vào/đầu ra, kiểm thử cục bộ với apify run, sau đó triển khai với apify push. Bao gồm xác thực lược đồ đầu vào và đầu ra, đóng gói Docker và tùy chọn thanh toán theo sự kiện...
official
apify-audience-analysis
apify
Trích xuất nhân khẩu học đối tượng, mô hình tương tác và dữ liệu hành vi từ Facebook, Instagram, YouTube và TikTok. Hỗ trợ hơn 18 Actor chuyên biệt bao gồm nhân khẩu học người theo dõi, chỉ số tương tác, bình luận và phân tích hồ sơ trên cả bốn nền tảng. Cung cấp ba định dạng đầu ra: hiển thị trò chuyện nhanh, xuất CSV hoặc xuất JSON để phân tích tiếp theo. Yêu cầu mã thông báo Apify và công cụ CLI mcpc; sử dụng tính năng lấy lược đồ động để điều chỉnh đầu vào theo yêu cầu của từng Actor. Bao gồm cấu trúc...
official
apify-brand-reputation-monitoring
apify
Giám sát danh tiếng thương hiệu trên Google Maps, Booking.com, TripAdvisor, Facebook, Instagram, YouTube và TikTok. Hỗ trợ hơn 16 Apify Actor chuyên dụng bao gồm đánh giá, xếp hạng, bình luận và đề cập trên tất cả các nền tảng chính. Định dạng đầu ra linh hoạt: hiển thị kết quả trong chat, xuất ra CSV hoặc lưu dưới dạng JSON để phân tích tiếp theo. Yêu cầu mã thông báo Apify và Node.js 20.6+; sử dụng CLI mcpc để tự động tìm nạp lược đồ Actor và tham số đầu vào. Quy trình làm việc hướng dẫn người dùng chọn nền tảng,...
official
apify-competitor-intelligence
apify
Phân tích đối thủ đa nền tảng qua Apify Actors cho Google Maps, Booking.com, Facebook, Instagram, YouTube và TikTok. Bao gồm hơn 25 Actors chuyên biệt trên bảy nền tảng, mỗi Actor được tối ưu hóa cho các loại phân tích cụ thể: trích xuất dữ liệu doanh nghiệp, so sánh đánh giá, giám sát chiến lược quảng cáo, hiệu suất nội dung và thông tin chi tiết về khán giả. Yêu cầu token Apify, Node.js 20.6+ và công cụ CLI mcpc để tìm nạp lược đồ Actor và chạy phân tích động. Hỗ trợ ba định dạng đầu ra: hiển thị chat nhanh,...
official
apify-content-analytics
apify
Phân tích nội dung đa nền tảng qua Apify Actors cho Instagram, Facebook, YouTube và TikTok. Hỗ trợ hơn 17 Actor chuyên biệt bao gồm bài đăng, reel, story, bình luận, hashtag, người theo dõi và quảng cáo trên cả bốn nền tảng. Tự động lấy lược đồ Actor bằng mcpc CLI để xác định đầu vào cần thiết và trường đầu ra khả dụng. Xuất kết quả dưới ba định dạng: hiển thị nhanh trong chat, xuất CSV hoặc xuất JSON với số lượng kết quả tùy chỉnh. Yêu cầu token Apify trong tệp .env và Node.js 20.6+...
official