five

🔴 Page Scraper 🔴 Daddy

收藏
RapidAPI2025-07-25 更新2024-05-11 收录
下载链接:
https://rapidapi.com/DaddyApi/api/page-scraper-daddy
下载链接
链接失效反馈
官方服务:
资源简介:
Delivers dynamic HTML content and high-fidelity page screenshots using real browsers and rotating proxies—making it nearly undetectable to anti-bot systems.
创建时间:
2025-07-25
原始信息汇总

🔴 Page Scraper 🔴 Daddy 数据集概述

基本信息

  • API名称: Page Scraper Daddy
  • 类别: Tools
  • 提供商: DaddyApi
  • 订阅人数: 33
  • 价格方案:
    • BASIC: $0.00 / mo
    • PRO: $9.99 / mo
    • ULTRA: $29.99 / mo
    • MEGA: $69.69 / mo
  • 免费使用限制: 20 requests per minute

API概述

Page Scraper API是一款先进的网页抓取工具,用于内容监控和竞争情报收集。其主要特点包括:

  • 真实浏览器模拟: 使用真实的浏览器指纹(用户代理、视口设置、触摸支持等)模拟移动或桌面设备。
  • 轮换代理: 每10分钟更换一次代理IP,减少被目标网站标记或封锁的风险。
  • 高质量输出: 支持完全渲染的HTML或高质量截图,30秒超时设计适用于复杂页面加载。
  • 强大的错误处理: 提供清晰的状态和反馈,确保操作顺畅。

主要功能

  • 真实模拟:
    • 移动设备: 返回移动特定的HTML或截图,模拟真实移动设备。
    • 桌面设备: 提供真实的桌面渲染,模拟标准桌面浏览器环境。
  • 轮换代理基础设施: 每个请求使用不同的IP,避免被封锁。
  • 灵活的输出: 支持HTML抓取和截图捕获。

API端点

  1. Health Check Endpoint

    • 端点: GET /health
    • 用途: 检查API是否运行。
    • 响应示例: json { "status": "ok" }
  2. Stealth Mobile HTML Renderer

    • 端点: POST /mobile/html

    • 请求体: json { "url": "https://target-website.com" }

    • 返回: 成功时返回完全渲染的HTML内容,失败时返回HTTP 500错误。

  3. Stealth Desktop HTML Renderer

    • 端点: POST /desktop/html

    • 请求体: json { "url": "https://target-website.com" }

    • 返回: 成功时返回完全渲染的HTML内容,失败时返回HTTP 500错误。

  4. Stealth Mobile Screenshot Capture

    • 端点: POST /mobile/screenshot

    • 请求体: json { "url": "https://target-website.com" }

    • 返回: 成功时返回PNG格式的截图,失败时返回HTTP 500错误。

  5. Stealth Desktop Screenshot Capture

    • 端点: POST /desktop/screenshot

    • 请求体: json { "url": "https://target-website.com" }

    • 返回: 成功时返回PNG格式的截图,失败时返回HTTP 500错误。

错误处理

  • 超时和服务器错误: 如果渲染超过30秒或后端浏览器服务失败,返回HTTP 500错误。
  • 验证错误: 提供无效URL时,返回适当的HTTP状态码。

服务条款

  • 使用限制: 仅限合法用途,禁止未经授权的抓取或绕过网站安全机制。
  • 可接受用途: 用于SEO监控、链接验证和竞争分析。
  • 免责声明: 服务按“原样”提供,不保证不间断服务。
  • 服务变更: 保留随时修改、暂停或终止服务的权利。
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集提供动态HTML内容和高保真页面截图服务,采用真实浏览器和轮换代理技术,能有效规避反机器人系统的检测。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作