DocForge
收藏RapidAPI2026-03-29 更新2026-03-30 收录
下载链接:
https://rapidapi.com/wtsng85/api/docforge1
下载链接
链接失效反馈官方服务:
资源简介:
Complete PDF processing API — generate PDFs from HTML/templates, merge, split, encrypt, and extract text/tables. Built on WeasyPrint for pixel-perfect rendering.
创建时间:
2026-03-29
原始信息汇总
DocForge 数据集概述
数据集基本信息
- 数据集名称: DocForge
- 类别: Commerce
- 提供者: Dave Sng
- 订阅者数量: 1
- API版本: v1 (current)
定价计划
- BASIC: $0.00 / 月
- PRO: $9.99 / 月
- ULTRA: $29.99 / 月
- MEGA: $99.99 / 月
API 核心描述
DocForge 是一个全面的 PDF 处理 API,涵盖 PDF 生命周期的每个阶段。它能够从 HTML/CSS 或 Jinja2 模板生成精美的 PDF,操作现有文档(合并、拆分、加密),并提取结构化数据(文本和表格)。该 API 基于 WeasyPrint 实现像素级完美的 CSS 渲染,并基于 pdfplumber 实现精确的数据提取。所有端点均返回即时结果,并附带使用情况跟踪标头。
端点功能详述
1. HTML 转 PDF
- 端点:
POST /v1/pdf/from-html - 功能: 将原始 HTML 和 CSS 转换为样式化的 PDF 文档。
- 主要参数:
html: 要转换的 HTML 内容(必需)css: CSS 样式表page_size: 页面尺寸(默认 A4)orientation: 方向(默认 portrait)margin_mm: 页边距(mm)
- 响应: 二进制 PDF 文件 (
application/pdf)
2. 模板转 PDF
- 端点:
POST /v1/pdf/from-template - 功能: 使用动态数据渲染 Jinja2 HTML 模板,然后转换为 PDF。适用于发票、报告和证书。
- 主要参数:
template: Jinja2 HTML 模板(必需,最多 500K 字符)data: 注入模板的 JSON 数据(必需)css: CSS 样式表page_size: 页面尺寸orientation: 方向
- 响应: 二进制 PDF 文件
3. 合并 PDF
- 端点:
POST /v1/pdf/merge - 功能: 将多个 PDF 文件合并为单个文档。
- 内容类型:
multipart/form-data - 主要参数:
files: 要合并的 PDF 文件数组(必需,2-20 个文件)
- 响应: 合并后的 PDF
4. 拆分 PDF
- 端点:
POST /v1/pdf/split - 功能: 从 PDF 文档中提取特定页面。
- 内容类型:
multipart/form-data - 主要参数:
file: 源 PDF 文件(必需)pages: 页面范围字符串(必需,例如 "1-3,5,7-9",1-起始索引)
- 响应: 仅包含提取页面的 PDF
5. 加密 / 解密 PDF
- 端点:
POST /v1/pdf/encrypt - 功能: 为 PDF 添加或移除密码保护。
- 内容类型:
multipart/form-data - 主要参数:
file: PDF 文件(必需)password: 密码(必需,1-256 字符)action: 操作(默认 encrypt,可选 encrypt 或 decrypt)
- 响应: 受保护或未受保护的 PDF
6. PDF 元数据
- 端点:
POST /v1/pdf/metadata - 功能: 读取或更新 PDF 元数据(标题、作者、主题、关键词)。
- 内容类型:
multipart/form-data - 主要参数:
file: PDF 文件(必需)title: 设置新标题author: 设置新作者subject: 设置新主题keywords: 设置新关键词
- 响应模式:
- 读取模式(不提供更新字段): 返回 JSON 格式的元数据
- 更新模式(提供任何字段): 返回更新后的 PDF
7. 提取文本
- 端点:
POST /v1/pdf/extract-text - 功能: 从 PDF 文档中提取所有文本内容。
- 内容类型:
multipart/form-data - 主要参数:
file: 要提取文本的 PDF 文件(必需)
- 响应: JSON 格式,包含页数、提取的文本内容和字数统计。
8. 提取表格
- 端点:
POST /v1/pdf/extract-tables - 功能: 从 PDF 中提取表格数据为结构化数组。
- 内容类型:
multipart/form-data - 主要参数:
file: 要提取表格的 PDF 文件(必需)
- 响应: JSON 格式,包含页数、表格数组和表格数量。
错误处理
所有错误均返回 JSON 格式响应,包含 success、error 和 detail 字段。部分错误代码与描述:
400:too_few_files- 合并至少需要 2 个文件400:too_many_files- 每次合并最多 20 个文件400:invalid_action- 加密操作必须为 "encrypt" 或 "decrypt"422:validation_error- 请求参数无效500:pdf_error- PDF 处理失败
响应标头
X-Request-ID: 唯一的 8 字符请求标识符X-API-Version: 当前 API 版本
使用案例
- 发票生成 - 将包含动态数据的模板渲染为专业的 PDF
- 文档管理 - 合并、拆分和加密 PDF 文件
- 数据提取 - 从 PDF 报告中提取文本和表格
- 报告自动化 - 将 HTML 仪表板转换为 PDF
- 元数据管理 - 以编程方式读取或更新 PDF 属性
- 合规性 - 为审计和合规工作流程提取文本
搜集汇总
数据集介绍

背景与挑战
背景概述
DocForge是一个基于WeasyPrint的PDF处理API工具,支持HTML/模板转PDF、文档合并拆分、加密及文本表格提取等功能,可实现精准渲染。
以上内容由遇见数据集搜集并总结生成



