PDF Scraper
收藏RapidAPI2025-08-21 更新2025-08-23 收录
下载链接:
https://rapidapi.com/jc1234/api/pdf-scraper
下载链接
链接失效反馈官方服务:
资源简介:
PDF Scraper API with advanced OCR technology to extract text from any PDF URL instantly. Supports 28 languages. Only pay for what you need at $0.0015 per Document. Handles large PDFs with many pages. No file uploads needed - just provide a URL to scrape PDF text.
创建时间:
2025-08-21
原始信息汇总
PDF Scraper API 数据集概述
基本信息
- API名称:PDF Scraper
- 提供商:JC
- 订阅者数量:5
- 类别:Visual Recognition
- 定价模式:Freemium
- 基础套餐:$0.00 / 月
- 按量付费:$0.0015 / 每份完整文档
核心功能
- PDF文本提取:通过URL直接提取PDF文本内容,无需文件上传
- OCR技术支持:采用先进的光学字符识别技术,支持扫描文档
- 多语言支持:支持28种语言,包括英语、西班牙语、法语、德语、中文(简体和繁体)、日语、韩语、阿拉伯语、俄语等
- 大文档处理:支持最多300页的大型PDF文档
- 结构化输出:提供按页组织的文本数据
技术规格
- API端点:
POST /extract/text - 请求头要求:
X-RapidAPI-Key: 用户API密钥X-RapidAPI-Host: pdf-scraper-api.p.rapidapi.comContent-Type: application/json
- 请求参数:
pdfUrl: PDF文档的URL(必需)language: OCR语言代码(可选,默认为"eng")
- 响应格式:JSON结构,包含成功状态、页面文本内容、处理时间和元数据
性能指标
- 流行度评分:8.8
- 服务等级:100%
- 延迟:3568ms
- 测试覆盖率:100%
支持的语言代码
- 阿拉伯语 (ara)、保加利亚语 (bul)、简体中文 (chs)、繁体中文 (cht)
- 克罗地亚语 (hrv)、捷克语 (cze)、丹麦语 (dan)、荷兰语 (dut)
- 英语 (eng)、芬兰语 (fin)、法语 (fre)、德语 (ger)
- 希腊语 (gre)、匈牙利语 (hun)、韩语 (kor)、意大利语 (ita)
- 日语 (jpn)、波兰语 (pol)、葡萄牙语 (por)、俄语 (rus)
- 斯洛文尼亚语 (slv)、西班牙语 (spa)、瑞典语 (swe)、泰语 (tha)
- 土耳其语 (tur)、乌克兰语 (ukr)、越南语 (vnm)、自动检测 (auto)
适用场景
- 文档处理与自动化:发票处理、简历解析、合同分析、报告生成
- 数据提取与挖掘:研究论文分析、财务文档处理、政府文档解析、产品目录提取
- 内容迁移与转换:网站内容迁移、数字化转型、档案数字化、SEO优化
开发者资源
- 多种语言SDK支持:JavaScript/Node.js、Python、Java、Ruby、Go
- 完整错误处理:提供详细的错误代码和解决方案
- 全面文档:包含快速入门指南、代码示例和API参考



