five

PDF Scraper

收藏
RapidAPI2025-08-21 更新2025-08-23 收录
下载链接:
https://rapidapi.com/jc1234/api/pdf-scraper
下载链接
链接失效反馈
官方服务:
资源简介:
PDF Scraper API with advanced OCR technology to extract text from any PDF URL instantly. Supports 28 languages. Only pay for what you need at $0.0015 per Document. Handles large PDFs with many pages. No file uploads needed - just provide a URL to scrape PDF text.
创建时间:
2025-08-21
原始信息汇总

PDF Scraper API 数据集概述

基本信息

  • API名称:PDF Scraper
  • 提供商:JC
  • 订阅者数量:5
  • 类别:Visual Recognition
  • 定价模式:Freemium
  • 基础套餐:$0.00 / 月
  • 按量付费:$0.0015 / 每份完整文档

核心功能

  • PDF文本提取:通过URL直接提取PDF文本内容,无需文件上传
  • OCR技术支持:采用先进的光学字符识别技术,支持扫描文档
  • 多语言支持:支持28种语言,包括英语、西班牙语、法语、德语、中文(简体和繁体)、日语、韩语、阿拉伯语、俄语等
  • 大文档处理:支持最多300页的大型PDF文档
  • 结构化输出:提供按页组织的文本数据

技术规格

  • API端点POST /extract/text
  • 请求头要求
    • X-RapidAPI-Key: 用户API密钥
    • X-RapidAPI-Host: pdf-scraper-api.p.rapidapi.com
    • Content-Type: application/json
  • 请求参数
    • pdfUrl: PDF文档的URL(必需)
    • language: OCR语言代码(可选,默认为"eng")
  • 响应格式:JSON结构,包含成功状态、页面文本内容、处理时间和元数据

性能指标

  • 流行度评分:8.8
  • 服务等级:100%
  • 延迟:3568ms
  • 测试覆盖率:100%

支持的语言代码

  • 阿拉伯语 (ara)、保加利亚语 (bul)、简体中文 (chs)、繁体中文 (cht)
  • 克罗地亚语 (hrv)、捷克语 (cze)、丹麦语 (dan)、荷兰语 (dut)
  • 英语 (eng)、芬兰语 (fin)、法语 (fre)、德语 (ger)
  • 希腊语 (gre)、匈牙利语 (hun)、韩语 (kor)、意大利语 (ita)
  • 日语 (jpn)、波兰语 (pol)、葡萄牙语 (por)、俄语 (rus)
  • 斯洛文尼亚语 (slv)、西班牙语 (spa)、瑞典语 (swe)、泰语 (tha)
  • 土耳其语 (tur)、乌克兰语 (ukr)、越南语 (vnm)、自动检测 (auto)

适用场景

  • 文档处理与自动化:发票处理、简历解析、合同分析、报告生成
  • 数据提取与挖掘:研究论文分析、财务文档处理、政府文档解析、产品目录提取
  • 内容迁移与转换:网站内容迁移、数字化转型、档案数字化、SEO优化

开发者资源

  • 多种语言SDK支持:JavaScript/Node.js、Python、Java、Ruby、Go
  • 完整错误处理:提供详细的错误代码和解决方案
  • 全面文档:包含快速入门指南、代码示例和API参考
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作