five

Web Scraping API

收藏
RapidAPI2025-06-13 更新2025-04-26 收录
下载链接:
https://rapidapi.com/MGAdev/api/web-scraping-api1
下载链接
链接失效反馈
官方服务:
资源简介:
Web Scraping API to extract dynamic HTML, interact with elements, block ads/scripts, and capture screenshots — all in one request. Perfect for automation & data extraction.
创建时间:
2025-06-13
原始信息汇总

Web Scraping API 数据集概述

基本信息

  • API名称: Web Scraping API
  • 提供商: MGAdev
  • 类别: Tools
  • 基础URL: https://web-scraping-api1.p.rapidapi.com
  • 端点: POST /api/web-scraper
  • 版本: 1.0.0 (current)
  • 订阅计划:
    • BASIC: $0.00 / mo
    • PRO: $50.00 / mo
    • ULTRA: $85.00 / mo
    • MEGA: $150.00 / mo

主要功能

  • 提取动态网站的完整HTML内容
  • 捕获高质量的全页截图
  • 通过点击、等待和导航与元素交互
  • 自定义User-Agent和视口(模拟移动/桌面设备)
  • 屏蔽图片、广告、脚本和媒体以优化速度
  • 所有请求均通过4G住宅代理路由

参数说明

参数 类型 描述
url string 必需。目标URL
steps array 可选。操作如点击/等待
userAgent string 可选。自定义User-Agent字符串
viewport object 可选。模拟设备尺寸
screenshot number 1 = 捕获截图,0 = 跳过
blockImages boolean 可选。屏蔽图片
blockMedia boolean 可选。屏蔽视频/音频
blockScripts boolean 可选。屏蔽JavaScript

示例用例

  1. 基本HTML和截图: json { "url": "https://example.com" }

  2. 最快模式 - 仅HTML: json { "url": "https://example.com", "screenshot": 0, "blockImages": true, "blockMedia": true, "blockScripts": false }

  3. 自定义移动视图和User Agent: json { "url": "https://www.whatismybrowser.com/detect/what-is-my-user-agent/", "userAgent": "Mozilla/5.0 (Linux; Android 11; Pixel 4a (5G)) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/99.0.4812.0 Mobile Safari/537.36", "viewport": { "width": 353, "height": 745, "deviceScaleFactor": 3, "isMobile": true, "hasTouch": true, "isLandscape": false, "fullPage": false, "hideAcceptCookies": true, "hideAllAds": true } }

  4. 高级步骤 - 完整交互: json { "url": "https://www.test.com/", "steps": [ { "type": "click", "timeout": 6000, "selectors": ["button#btn_id"] }, { "type": "click", "timeout": 6000, "selectors": ["h3.test"] }, { "type": "waitForNavigation", "timeout": 6000 }, { "type": "click", "timeout": 1000, "selectors": ["input.iAgreeCheck"] }, { "type": "waitForElement", "timeout": 1000, "selectors": ["div.successDiv"] } ], "screenshot": 1 }

响应结构

json { "status": "success", "statusCode": 200, "js": true, "url": "https://example.com", "finalUrl": "https://example.com", "screenshot": "unique-id.png", "html": "<html>...</html>" }

错误示例

json { "status": "error", "message": "Invalid URL or server error." }

适用场景

  • 开发者构建数据驱动平台
  • SEO工具和分析提供商
  • 价格和产品跟踪系统
  • 自动化和测试工具

联系与支持

  • 联系邮箱: info@mga.dev
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
该数据集提供Web Scraping API服务,支持通过单一请求提取动态HTML、与页面元素交互、拦截广告和脚本,并能捕获屏幕截图。它专为自动化和数据提取任务设计,提供一体化的解决方案。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作