five

AgentFL-dev/qa_json_20251117

收藏
Hugging Face2025-12-16 更新2025-12-20 收录
下载链接:
https://hf-mirror.com/datasets/AgentFL-dev/qa_json_20251117
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含四个JSON/JSONL子集:1. `LongDocURL_json`:统一JSONL格式的长文档URL问答数据;2. `MMDOCRAG_json`:统一JSONL格式的MMDOCRAG问答数据;3. `CUAD_json`:JSONL格式的法律合同问答数据;4. `DUDE_json`:JSON格式的文档理解数据。所有文件使用统一字段:`doc_id`、`doc_type`、`question`、`answer`、`evidence_pages`、`evidence_sources`、`answer_format`,方便下游加载与训练。

This repo contains four JSON/JSONL subsets: 1. `LongDocURL_json`: LongDocURL QA data in unified JSONL format; 2. `MMDOCRAG_json`: MMDOCRAG QA data in unified JSONL format; 3. `CUAD_json`: CUAD (legal contracts) QA data as JSONL; 4. `DUDE_json`: DUDE document understanding data as JSON. All files use unified fields: `doc_id`, `doc_type`, `question`, `answer`, `evidence_pages`, `evidence_sources`, `answer_format`, facilitating downstream loading and training.
提供机构:
AgentFL-dev
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作