LongDocURL|文档理解数据集|多模态任务数据集
收藏LongDocURL 数据集概述
数据集简介
- 名称: LongDocURL
- 用途: 评估模型在长文档理解、推理和定位方面的能力。
- 数据量: 包含 2,325 个高质量的问答对,覆盖 396 个 PDF 格式的文档,总计超过 33,000 页。
- 数据格式: PDF 文件和问答对文件(.jsonl)。
数据集获取
- 数据集地址: LongDocURL
- 相关资源:
评估方法
-
下载与提取 PDF 文件:
- 从 LongDocURL 下载 PDF 和问答对文件。
- 使用 PyMuPDF 提取 PDF 文件为 png 和 json 文件,运行以下命令: bash bash utils/run_extract_ccpdf.sh
-
评估 API 模型:
- 运行以下命令进行评估: bash bash scripts/eval_api_models.sh
排行榜
| 模型 | 大小 | 理解能力 | 推理能力 | 定位能力 | 总分 |
|---|---|---|---|---|---|
| GPT-4o-24-05-13 🥇 | - | 68.6 | 59.9 | 59.6 | 64.5 |
| Gemini-1.5-Pro 🥈 | - | 55.7 | 43.4 | 46.4 | 50.9 |
| Qwen-VL-Max 🥉 | - | 58.8 | 43.9 | 36.0 | 49.5 |
| Qwen2-VL | 7B | 36.9 | 24.8 | 22.6 | 30.6 |
| LLaVA-OneVision-Chat | 7B | 30.5 | 19.0 | 18.7 | 25.0 |
| LLaVA-Next-Interleave-DPO | 7B | 21.6 | 13.9 | 7.6 | 16.2 |
| Llama-3.2 | 11B | 12.9 | 9.4 | 2.7 | 9.2 |

日食计算器
此日食计算器能够查询公元前3000至后3000年范围内的日食信息,生成每次日食的覆盖区、中心区范围数据,展示日食带的地图;并可根据用户在地图上点击的坐标在线计算该地日食各阶段时间、食分等观测信息。
国家天文科学数据中心 收录
Figshare
Figshare是一个在线数据共享平台,允许研究人员上传和共享各种类型的研究成果,包括数据集、论文、图像、视频等。它旨在促进科学研究的开放性和可重复性。
figshare.com 收录
China Health and Nutrition Survey (CHNS)
China Health and Nutrition Survey(CHNS)是一项由美国北卡罗来纳大学人口中心与中国疾病预防控制中心营养与健康所合作开展的长期开放性队列研究项目,旨在评估国家和地方政府的健康、营养与家庭计划政策对人群健康和营养状况的影响,以及社会经济转型对居民健康行为和健康结果的作用。该调查覆盖中国15个省份和直辖市的约7200户家庭、超过30000名个体,采用多阶段随机抽样方法,收集了家庭、个体以及社区层面的详细数据,包括饮食、健康、经济和社会因素等信息。自2011年起,CHNS不断扩展,新增多个城市和省份,并持续完善纵向数据链接,为研究中国社会经济变化与健康营养的动态关系提供了重要的数据支持。
www.cpc.unc.edu 收录
HazyDet
HazyDet是由解放军工程大学等机构创建的一个大规模数据集,专门用于雾霾场景下的无人机视角物体检测。该数据集包含383,000个真实世界实例,收集自自然雾霾环境和正常场景中人工添加的雾霾效果,以模拟恶劣天气条件。数据集的创建过程结合了深度估计和大气散射模型,确保了数据的真实性和多样性。HazyDet主要应用于无人机在恶劣天气条件下的物体检测,旨在提高无人机在复杂环境中的感知能力。
arXiv 收录
波士顿房价数据集
波士顿房价数据集是一个经典的机器学习数据集,通常用于回归任务,尤其是房价预测。下方文档中有所有字段顺序的描述。
阿里云天池 收录
