PDF Scraper

RapidAPI2025-08-21 更新2025-08-23 收录

下载链接：

https://rapidapi.com/jc1234/api/pdf-scraper

下载链接

链接失效反馈

官方服务：

资源简介：

PDF Scraper API with advanced OCR technology to extract text from any PDF URL instantly. Supports 28 languages. Only pay for what you need at $0.0015 per Document. Handles large PDFs with many pages. No file uploads needed - just provide a URL to scrape PDF text.

创建时间：

2025-08-21

原始信息汇总

PDF Scraper API 数据集概述

基本信息

API名称：PDF Scraper
提供商：JC
订阅者数量：5
类别：Visual Recognition
定价模式：Freemium
基础套餐：$0.00 / 月
按量付费：$0.0015 / 每份完整文档

核心功能

PDF文本提取：通过URL直接提取PDF文本内容，无需文件上传
OCR技术支持：采用先进的光学字符识别技术，支持扫描文档
多语言支持：支持28种语言，包括英语、西班牙语、法语、德语、中文（简体和繁体）、日语、韩语、阿拉伯语、俄语等
大文档处理：支持最多300页的大型PDF文档
结构化输出：提供按页组织的文本数据

技术规格

API端点：POST /extract/text
请求头要求：
- X-RapidAPI-Key: 用户API密钥
- X-RapidAPI-Host: pdf-scraper-api.p.rapidapi.com
- Content-Type: application/json
请求参数：
- pdfUrl: PDF文档的URL（必需）
- language: OCR语言代码（可选，默认为"eng"）
响应格式：JSON结构，包含成功状态、页面文本内容、处理时间和元数据

性能指标

流行度评分：8.8
服务等级：100%
延迟：3568ms
测试覆盖率：100%

支持的语言代码

阿拉伯语 (ara)、保加利亚语 (bul)、简体中文 (chs)、繁体中文 (cht)
克罗地亚语 (hrv)、捷克语 (cze)、丹麦语 (dan)、荷兰语 (dut)
英语 (eng)、芬兰语 (fin)、法语 (fre)、德语 (ger)
希腊语 (gre)、匈牙利语 (hun)、韩语 (kor)、意大利语 (ita)
日语 (jpn)、波兰语 (pol)、葡萄牙语 (por)、俄语 (rus)
斯洛文尼亚语 (slv)、西班牙语 (spa)、瑞典语 (swe)、泰语 (tha)
土耳其语 (tur)、乌克兰语 (ukr)、越南语 (vnm)、自动检测 (auto)

适用场景

文档处理与自动化：发票处理、简历解析、合同分析、报告生成
数据提取与挖掘：研究论文分析、财务文档处理、政府文档解析、产品目录提取
内容迁移与转换：网站内容迁移、数字化转型、档案数字化、SEO优化

开发者资源

多种语言SDK支持：JavaScript/Node.js、Python、Java、Ruby、Go
完整错误处理：提供详细的错误代码和解决方案
全面文档：包含快速入门指南、代码示例和API参考

5,000+

优质数据集

54 个

任务类型

进入经典数据集