AI Resume Parser
收藏AI Resume Parser 数据集概述
基本信息
- 数据集名称:AI Resume Parser
- 类别:Text Analysis
- 提供者:Digital AI
- 版本:0.1.0 (current)
- API 地址:https://rapidapi.com/oliverhetech/api/ai-resume-parser7
功能描述
AI 驱动的简历解析器,从 PDF、DOCX、TXT 和图像简历中提取结构化的 JSON 数据。
核心特性
- 多格式支持:PDF, DOCX, TXT, PNG, JPG, TIFF, WEBP。
- AI 视觉识别:使用 LLM 视觉直接读取简历布局,无 OCR 伪影。
- 多语言支持:自动检测英语、中文、日语、韩语。
- 结构化输出:返回包含 13 个以上数据字段的清晰 JSON。
- 快速处理:图像简历约 10 秒,基于文本的文档约 8 秒。
- 智能缓存:相同文件即时返回(0 毫秒)。
可提取字段
| 字段 | 描述 |
|---|---|
| name | 全名 |
| 电子邮件地址 | |
| phone | 电话号码 |
| location | 城市,国家 |
| LinkedIn 个人资料网址 | |
| website | 个人网站 |
| summary | 专业摘要 |
| education | 学位、学校、日期、GPA |
| work_experience | 公司、职位、日期、亮点 |
| skills | 技术和软技能 |
| languages | 口语语言 |
| certifications | 证书(包含颁发机构和日期) |
接口端点与使用方式
1. 上传文件解析
- 方法:POST
- 端点:
/v1/parse - Content-Type:
multipart/form-data - 参数:
file: resume.pdf
2. 通过 URL 解析
- 方法:POST
- 端点:
/v1/parse/url - Content-Type:
application/json - 请求体示例: json { "url": "https://example.com/resume.pdf" }
3. 通过 Base64 解析
- 方法:POST
- 端点:
/v1/parse/base64 - Content-Type:
application/json - 请求体示例: json { "content": "JVBERi0xLjQK...", "filename": "resume.pdf" }
可选参数
| 参数 | 类型 | 默认值 | 描述 |
|---|---|---|---|
| language_hint | string | auto | ISO 639-1 代码 (en, zh, ja, ko) |
| include_raw_text | boolean | false | 在响应中包含提取的原始文本 |
响应示例
json { "success": true, "data": { "name": "Johan Smith", "email": "johan@example.com", "phone": "123 333 4445", "location": "Oslo, Norway", "linkedin": "linkedin.com/in/johan.smith", "summary": "Full-Stack Developer with 6+ years...", "education": [ { "institution": "MIT", "degree": "B.S.", "field_of_study": "Computer Science", "start_date": "2017", "end_date": "2021" } ], "work_experience": [ { "company": "Google", "title": "Senior Engineer", "start_date": "2021", "end_date": "Present", "highlights": [ "Led team of 5 engineers", "Reduced costs by 40%" ] } ], "skills": ["Python", "React", "AWS", "Docker"], "languages": ["English", "Norwegian"], "certifications": [ { "name": "AWS Solutions Architect", "issuer": "Amazon", "date": "2022" } ] }, "metadata": { "processing_time_ms": 8600, "language_detected": "en", "page_count": 1, "cached": false } }
错误处理
所有响应均返回 "success": true/false。失败时响应示例:
json
{
"success": false,
"error": "Description of what went wrong"
}
常见错误:
- 文件过大 - 最大 10MB
- 不支持的文件类型 - 请使用 PDF, DOCX, TXT, PNG, JPG
- 无法提取有意义的文本 - 文件可能为空或已损坏
使用建议
- 最佳质量:上传高分辨率 PDF 或图像文件。
- 最快结果:基于文本的 PDF 和 DOCX 文件处理速度比图像快。
- 缓存机制:上传相同文件两次,第二次调用将在 0 毫秒内返回。
- 多栏简历:AI 视觉可以正确读取所有栏目,与基于 OCR 的解析器不同。




