five

AI Scraper Pro

收藏
RapidAPI2026-01-24 更新2024-10-26 收录
下载链接:
https://rapidapi.com/dataworks-collective-dataworks-collective-default/api/ai-scraper-pro
下载链接
链接失效反馈
官方服务:
资源简介:
AI Scraper Pro: Effortlessly extract data from any public website using AI and natural language.
创建时间:
2026-01-24
原始信息汇总

AI Scraper Pro 数据集概述

基本信息

  • 数据集名称:AI Scraper Pro
  • 类别:Artificial Intelligence/Machine Learning
  • 提供者:DataWorks Collective
  • 订阅者数量:81
  • API版本:v1 (current)
  • 服务等级:100% Service Level
  • 延迟:4738ms Latency
  • 测试通过率:100% Test
  • 流行度:2.1 Popularity

定价计划

  • BASIC:$0.00 / mo
  • PRO:$20.00 / mo
  • ULTRA:$75.00 / mo
  • MEGA:$150.00 / mo

功能描述

AI Scraper Pro 是一个强大的 API,旨在使网络数据提取变得简单易用。它允许用户通过自然语言描述所需数据,从任何公共网站抓取信息,无需配置或设置。该工具适用于从目录或列表页面(例如职位列表、房地产列表、产品列表、社交媒体帖子等)到详细内容页面(例如单个职位列表、房地产属性详情、产品信息等)的各种网络抓取任务,也可用于任何其他类型的公共网站。

核心特性

  • 自然语言数据提取:只需描述所需数据,API 将处理其余部分。
  • 支持多种用例:适用于从目录、详细内容页面等抓取数据。
  • 无需设置:无需复杂配置即可立即开始抓取。

工作原理

API 通过接受请求中的几个关键参数进行操作:

  • source:要抓取的公共网站的 URL。确保网站没有登录或付费墙。重要:使用 http://https://
  • prompt:用自然语言描述要提取的数据。建议包含返回 JSON 对象所需的键。
  • delay:指定抓取工具在尝试提取数据之前等待网站加载的时间(以毫秒为单位)。默认值为 5000 毫秒(5 秒)。如果抓取工具未返回结果,请尝试增加此延迟。

高级功能

  • 精度提升:对于具有复杂 HTML 结构或表格的网站,可使用 accuracy_boost 参数以提高准确性。此功能会将每次 API 调用的成本增加 4 个请求。
  • 代理支持:对于需要抓取跟踪 IP 地址的网站,AI Scraper Pro 提供内置代理轮换功能。可使用 proxy_country 参数来使用此功能。此功能会将每次 API 调用的成本增加 2 个请求。

代理国家/地区列表

  • Random Country: Random
  • United States: UnitedStates
  • Canada: Canada
  • Afghanistan: Afghanistan
  • Albania: Albania
  • Algeria: Algeria
  • Argentina: Argentina
  • Armenia: Armenia
  • Aruba: Aruba
  • Australia: Australia
  • Austria: Austria
  • Azerbaijan: Azerbaijan
  • Bahamas: Bahamas
  • Bahrain: Bahrain
  • Bangladesh: Bangladesh
  • Belarus: Belarus
  • Belgium: Belgium
  • Bosnia and Herzegovina: BosniaandHerzegovina
  • Brazil: Brazil
  • British Virgin Islands: BritishVirginIslands
  • Brunei: Brunei
  • Bulgaria: Bulgaria
  • Cambodia: Cambodia
  • Cameroon: Cameroon
  • Chile: Chile
  • China: China
  • Colombia: Colombia
  • Costa Rica: CostaRica
  • Croatia: Croatia
  • Cuba: Cuba
  • Cyprus: Cyprus
  • Czechia: Czechia
  • Denmark: Denmark
  • Dominican Republic: DominicanRepublic
  • Ecuador: Ecuador
  • Egypt: Egypt
  • El Salvador: ElSalvador
  • Estonia: Estonia
  • Ethiopia: Ethiopia
  • Finland: Finland
  • France: France
  • Georgia: Georgia
  • Germany: Germany
  • Ghana: Ghana
  • Greece: Greece
  • Guatemala: Guatemala
  • Guyana: Guyana
  • Hashemite Kingdom of Jordan: HashemiteKingdomofJordan
  • Hong Kong: HongKong
  • Hungary: Hungary
  • India: India
  • Indonesia: Indonesia
  • Iran: Iran
  • Iraq: Iraq
  • Ireland: Ireland
  • Israel: Israel
  • Italy: Italy
  • Jamaica: Jamaica
  • Japan: Japan
  • Kazakhstan: Kazakhstan
  • Kenya: Kenya
  • Kosovo: Kosovo
  • Kuwait: Kuwait
  • Latvia: Latvia
  • Liechtenstein: Liechtenstein
  • Luxembourg: Luxembourg
  • Macedonia: Macedonia
  • Madagascar: Madagascar
  • Malaysia: Malaysia
  • Mauritius: Mauritius
  • Mexico: Mexico
  • Mongolia: Mongolia
  • Montenegro: Montenegro
  • Morocco: Morocco
  • Mozambique: Mozambique
  • Myanmar: Myanmar
  • Nepal: Nepal
  • Netherlands: Netherlands
  • New Zealand: NewZealand
  • Nigeria: Nigeria
  • Norway: Norway
  • Oman: Oman
  • Pakistan: Pakistan
  • Palestine: Palestine
  • Panama: Panama
  • Papua New Guinea: PapuaNewGuinea
  • Paraguay: Paraguay
  • Peru: Peru
  • Philippines: Philippines
  • Poland: Poland
  • Portugal: Portugal
  • Puerto Rico: PuertoRico
  • Qatar: Qatar
  • Republic of Lithuania: RepublicofLithuania
  • Republic of Moldova: RepublicofMoldova
  • Romania: Romania
  • Russia: Russia
  • Saudi Arabia: SaudiArabia
  • Senegal: Senegal
  • Serbia: Serbia
  • Seychelles: Seychelles
  • Singapore: Singapore
  • Slovakia: Slovakia
  • Slovenia: Slovenia
  • Somalia: Somalia
  • South Africa: SouthAfrica
  • South Korea: SouthKorea
  • Spain: Spain
  • Sri Lanka: SriLanka
  • Sudan: Sudan
  • Suriname: Suriname
  • Sweden: Sweden
  • Switzerland: Switzerland
  • Syria: Syria
  • Taiwan: Taiwan
  • Tajikistan: Tajikistan
  • Thailand: Thailand
  • Trinidad and Tobago: TrinidadandTobago
  • Tunisia: Tunisia
  • Turkey: Turkey
  • Uganda: Uganda
  • Ukraine: Ukraine
  • United Arab Emirates: UnitedArabEmirates
  • United Kingdom: UnitedKingdom
  • Uzbekistan: Uzbekistan
  • Venezuela: Venezuela
  • Vietnam: Vietnam
  • Zambia: Zambia

成本计算

每次 API 调用根据所用参数消耗一定数量的请求:

  • 标准调用:1 个请求(默认)
  • 使用精度提升:1 个请求 + 4 个额外请求 = 5 个请求
  • 使用代理:1 个请求 + 2 个额外请求 = 3 个请求
  • 同时使用精度提升和代理:1 个请求 + 4 个额外请求 + 2 个额外请求 = 7 个请求

示例请求

  1. 列表页基本请求:从搜索页面抓取顶级 API。 json { "source": "https://rapidapi.com/search/Artificial%20Intelligence%2FMachine%20Learning?sortBy=ByRelevance", "prompt": "Get the top APIs and their URLs", "delay": 5000 }

  2. 详情页请求:抓取 API 详情,如流行度、服务等级和延迟。 json { "source": "https://rapidapi.com/fortunehoppers/api/runwayml", "prompt": "Get the popularity, Service Level, and Latency", "delay": 5000 }

  3. 使用精度提升的请求:针对更复杂的 HTML 结构或确保更高准确性。 json { "source": "https://rapidapi.com/fortunehoppers/api/runwayml", "prompt": "Get the popularity, Service Level, and Latency", "delay": 5000, "accuracy_boost": true }

  4. 使用代理的请求:用于需要增加匿名性或 IP 跟踪可能成为问题的情况。 json { "source": "https://rapidapi.com/fortunehoppers/api/runwayml", "prompt": "Get the popularity, Service Level, and Latency", "delay": 5000, "proxy_country": "UnitedStates" }

  5. 同时使用精度提升和代理的请求:抓取详情页,同时提高准确性并使用代理增加匿名性。 json { "source": "https://rapidapi.com/fortunehoppers/api/runwayml", "prompt": "Get the popularity, Service Level, and Latency", "delay": 5000, "accuracy_boost": true, "proxy_country": "UnitedStates" }

重要注意事项

  • 仅限公共网站:确保要抓取的网站是公开的(没有登录或付费墙)。
  • 代理参数:使用代理时,请始终包含正确的 proxy_country 参数。从提供的列表中选择一个国家/地区。
  • 资源成本:请注意,使用 accuracy_boostproxy 功能将消耗更多可用请求。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作