Amazon Complete Reviews Scraper
收藏Amazon Complete Reviews Scraper 数据集概述
数据集名称
Amazon Complete Reviews Scraper
数据集类型
API(应用程序编程接口)
核心功能
- 高性能亚马逊产品评论爬取工具。
- 支持持久用户会话,可爬取所有评论页面直至最后一页,确保获得100%完整的数据集,不受评论总数限制。
定价模式
- 付费模式:按事件付费(Pay-Per-Event)。
- 计费方式:根据单次运行中爬取的总评论量计费。随着爬取量增加,每条评论的成本自动降低。
技术原理
- 使用会话管理器跟踪用户并维持爬取进度。
- 每个用户(通过API密钥、RapidAPI ID或IP识别)被分配一个唯一的
assigned_cookie_key。 - 工作流程:
- 身份映射:识别调用请求的用户。
- 会话分配:检查用户是否已有保存的亚马逊会话以保持连续性。
- 身份验证:若提供
cookies,则验证并“锁定”这些cookie至用户身份,以避免机器人检测。 - 持久化进度:爬取多页时,将分页
token保存在用户元数据中。 - 穷尽式爬取:迭代爬取所有可用页面,直至平台上的最后一篇评论,无页面限制。
输入配置
| 字段 | 类型 | 描述 |
|---|---|---|
| asin | String |
必需。10位亚马逊标准识别码。 |
| action | String |
get-all-reviews(爬取所有页面直至结束)或get-top-reviews(标准爬取)。 |
| page | Integer |
起始页码(默认:1)。 |
| country | String |
可选的市场国家代码(如US、UK、DE)或域名(如amazon.co.uk)。默认为US。 |
| cookies | Array |
从浏览器导出的cookie的JSON数组。get-all-reviews操作必需。 |
国家/市场行为
- 若提供
country,所有请求将使用该亚马逊市场域名。 - 若省略
country,爬虫默认使用US(amazon.com)。 - 对于
action = "get-all-reviews",将自动切换cookie以匹配提供的country。
输入示例
json { "asin":"B0F5YNX43T", "action": "get-all-reviews", "page": 1, "country": "UK", "cookies": [ { "name": "session-id", "value": "142-0510088-3621413", "domain": ".amazon.co.uk" } ] }
输出结构
API返回一个清晰、原始的JSON响应。数据结构包含产品指标和完整的评论数组。
输出示例
json { "status": "success", "data": { "reviews_metrics": { "average_rating": "4.8 out of 5 stars", "total_ratings_count": 69 }, "reviews": [ { "id": "R3EYOD2F1W6BMV", "reviewer_name": "Roy", "rating": "5.0 out of 5 stars", "title": "To good to pass up!!", "body": "It is a great pc for gaming...", "variant": "Style: Legion Tower 5i - RTX 5070", "date": "January 7, 2026", "location": "Reviewed in the United States" } // ... 更多评论对象 ] } }
评论数据结构
每条评论包含以下字段:
id:评论唯一标识。reviewer_name:评论者姓名。rating:评分(例如“5.0 out of 5 stars”)。title:评论标题。body:评论正文。variant:产品款式/变体。date:评论日期。location:评论地点。
提供商信息
- 创建者:ihunna
- 类别:eCommerce



