AI Scraper Pro
收藏AI Scraper Pro 数据集概述
基本信息
- 数据集名称:AI Scraper Pro
- 类别:Artificial Intelligence/Machine Learning
- 提供者:DataWorks Collective
- 订阅者数量:81
- API版本:v1 (current)
- 服务等级:100% Service Level
- 延迟:4738ms Latency
- 测试通过率:100% Test
- 流行度:2.1 Popularity
定价计划
- BASIC:$0.00 / mo
- PRO:$20.00 / mo
- ULTRA:$75.00 / mo
- MEGA:$150.00 / mo
功能描述
AI Scraper Pro 是一个强大的 API,旨在使网络数据提取变得简单易用。它允许用户通过自然语言描述所需数据,从任何公共网站抓取信息,无需配置或设置。该工具适用于从目录或列表页面(例如职位列表、房地产列表、产品列表、社交媒体帖子等)到详细内容页面(例如单个职位列表、房地产属性详情、产品信息等)的各种网络抓取任务,也可用于任何其他类型的公共网站。
核心特性
- 自然语言数据提取:只需描述所需数据,API 将处理其余部分。
- 支持多种用例:适用于从目录、详细内容页面等抓取数据。
- 无需设置:无需复杂配置即可立即开始抓取。
工作原理
API 通过接受请求中的几个关键参数进行操作:
- source:要抓取的公共网站的 URL。确保网站没有登录或付费墙。重要:使用
http://或https://。 - prompt:用自然语言描述要提取的数据。建议包含返回 JSON 对象所需的键。
- delay:指定抓取工具在尝试提取数据之前等待网站加载的时间(以毫秒为单位)。默认值为 5000 毫秒(5 秒)。如果抓取工具未返回结果,请尝试增加此延迟。
高级功能
- 精度提升:对于具有复杂 HTML 结构或表格的网站,可使用
accuracy_boost参数以提高准确性。此功能会将每次 API 调用的成本增加 4 个请求。 - 代理支持:对于需要抓取跟踪 IP 地址的网站,AI Scraper Pro 提供内置代理轮换功能。可使用
proxy_country参数来使用此功能。此功能会将每次 API 调用的成本增加 2 个请求。
代理国家/地区列表
- Random Country: Random
- United States: UnitedStates
- Canada: Canada
- Afghanistan: Afghanistan
- Albania: Albania
- Algeria: Algeria
- Argentina: Argentina
- Armenia: Armenia
- Aruba: Aruba
- Australia: Australia
- Austria: Austria
- Azerbaijan: Azerbaijan
- Bahamas: Bahamas
- Bahrain: Bahrain
- Bangladesh: Bangladesh
- Belarus: Belarus
- Belgium: Belgium
- Bosnia and Herzegovina: BosniaandHerzegovina
- Brazil: Brazil
- British Virgin Islands: BritishVirginIslands
- Brunei: Brunei
- Bulgaria: Bulgaria
- Cambodia: Cambodia
- Cameroon: Cameroon
- Chile: Chile
- China: China
- Colombia: Colombia
- Costa Rica: CostaRica
- Croatia: Croatia
- Cuba: Cuba
- Cyprus: Cyprus
- Czechia: Czechia
- Denmark: Denmark
- Dominican Republic: DominicanRepublic
- Ecuador: Ecuador
- Egypt: Egypt
- El Salvador: ElSalvador
- Estonia: Estonia
- Ethiopia: Ethiopia
- Finland: Finland
- France: France
- Georgia: Georgia
- Germany: Germany
- Ghana: Ghana
- Greece: Greece
- Guatemala: Guatemala
- Guyana: Guyana
- Hashemite Kingdom of Jordan: HashemiteKingdomofJordan
- Hong Kong: HongKong
- Hungary: Hungary
- India: India
- Indonesia: Indonesia
- Iran: Iran
- Iraq: Iraq
- Ireland: Ireland
- Israel: Israel
- Italy: Italy
- Jamaica: Jamaica
- Japan: Japan
- Kazakhstan: Kazakhstan
- Kenya: Kenya
- Kosovo: Kosovo
- Kuwait: Kuwait
- Latvia: Latvia
- Liechtenstein: Liechtenstein
- Luxembourg: Luxembourg
- Macedonia: Macedonia
- Madagascar: Madagascar
- Malaysia: Malaysia
- Mauritius: Mauritius
- Mexico: Mexico
- Mongolia: Mongolia
- Montenegro: Montenegro
- Morocco: Morocco
- Mozambique: Mozambique
- Myanmar: Myanmar
- Nepal: Nepal
- Netherlands: Netherlands
- New Zealand: NewZealand
- Nigeria: Nigeria
- Norway: Norway
- Oman: Oman
- Pakistan: Pakistan
- Palestine: Palestine
- Panama: Panama
- Papua New Guinea: PapuaNewGuinea
- Paraguay: Paraguay
- Peru: Peru
- Philippines: Philippines
- Poland: Poland
- Portugal: Portugal
- Puerto Rico: PuertoRico
- Qatar: Qatar
- Republic of Lithuania: RepublicofLithuania
- Republic of Moldova: RepublicofMoldova
- Romania: Romania
- Russia: Russia
- Saudi Arabia: SaudiArabia
- Senegal: Senegal
- Serbia: Serbia
- Seychelles: Seychelles
- Singapore: Singapore
- Slovakia: Slovakia
- Slovenia: Slovenia
- Somalia: Somalia
- South Africa: SouthAfrica
- South Korea: SouthKorea
- Spain: Spain
- Sri Lanka: SriLanka
- Sudan: Sudan
- Suriname: Suriname
- Sweden: Sweden
- Switzerland: Switzerland
- Syria: Syria
- Taiwan: Taiwan
- Tajikistan: Tajikistan
- Thailand: Thailand
- Trinidad and Tobago: TrinidadandTobago
- Tunisia: Tunisia
- Turkey: Turkey
- Uganda: Uganda
- Ukraine: Ukraine
- United Arab Emirates: UnitedArabEmirates
- United Kingdom: UnitedKingdom
- Uzbekistan: Uzbekistan
- Venezuela: Venezuela
- Vietnam: Vietnam
- Zambia: Zambia
成本计算
每次 API 调用根据所用参数消耗一定数量的请求:
- 标准调用:1 个请求(默认)
- 使用精度提升:1 个请求 + 4 个额外请求 = 5 个请求
- 使用代理:1 个请求 + 2 个额外请求 = 3 个请求
- 同时使用精度提升和代理:1 个请求 + 4 个额外请求 + 2 个额外请求 = 7 个请求
示例请求
-
列表页基本请求:从搜索页面抓取顶级 API。 json { "source": "https://rapidapi.com/search/Artificial%20Intelligence%2FMachine%20Learning?sortBy=ByRelevance", "prompt": "Get the top APIs and their URLs", "delay": 5000 }
-
详情页请求:抓取 API 详情,如流行度、服务等级和延迟。 json { "source": "https://rapidapi.com/fortunehoppers/api/runwayml", "prompt": "Get the popularity, Service Level, and Latency", "delay": 5000 }
-
使用精度提升的请求:针对更复杂的 HTML 结构或确保更高准确性。 json { "source": "https://rapidapi.com/fortunehoppers/api/runwayml", "prompt": "Get the popularity, Service Level, and Latency", "delay": 5000, "accuracy_boost": true }
-
使用代理的请求:用于需要增加匿名性或 IP 跟踪可能成为问题的情况。 json { "source": "https://rapidapi.com/fortunehoppers/api/runwayml", "prompt": "Get the popularity, Service Level, and Latency", "delay": 5000, "proxy_country": "UnitedStates" }
-
同时使用精度提升和代理的请求:抓取详情页,同时提高准确性并使用代理增加匿名性。 json { "source": "https://rapidapi.com/fortunehoppers/api/runwayml", "prompt": "Get the popularity, Service Level, and Latency", "delay": 5000, "accuracy_boost": true, "proxy_country": "UnitedStates" }
重要注意事项
- 仅限公共网站:确保要抓取的网站是公开的(没有登录或付费墙)。
- 代理参数:使用代理时,请始终包含正确的
proxy_country参数。从提供的列表中选择一个国家/地区。 - 资源成本:请注意,使用
accuracy_boost或proxy功能将消耗更多可用请求。



