DLUE
收藏arXiv2023-05-16 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2305.09520v1
下载链接
链接失效反馈官方服务:
资源简介:
DLUE数据集是由中国科学院软件研究所创建,旨在全面评估文档理解能力,包括文档分类、结构分析、信息提取和文档转录四个方面。该数据集涵盖多种文档类型和领域,包含10个不同任务的数据集,总计约10,000条数据。创建过程中,研究团队精心选择了多样化的文档样本,并对其进行了标准化处理。DLUE数据集的应用领域广泛,旨在解决机器在处理长文档时的理解和分析问题,提高机器对复杂文档内容的处理能力。
提供机构:
中国科学院软件研究所
创建时间:
2023-05-16
搜集汇总
数据集介绍

背景与挑战
背景概述
DLUE数据集由中国科学院软件研究所创建,旨在全面评估文档理解能力,涵盖文档分类、结构分析、信息提取和文档转录四个核心方面。该数据集包含10个不同任务、约10,000条数据,覆盖多种文档类型和领域,经过标准化处理,专门用于解决机器处理长文档时的理解和分析挑战,提升对复杂文档内容的处理能力。
以上内容由遇见数据集搜集并总结生成



