DLUE
收藏arXiv2023-05-16 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2305.09520v1
下载链接
链接失效反馈资源简介:
DLUE数据集是由中国科学院软件研究所创建,旨在全面评估文档理解能力,包括文档分类、结构分析、信息提取和文档转录四个方面。该数据集涵盖多种文档类型和领域,包含10个不同任务的数据集,总计约10,000条数据。创建过程中,研究团队精心选择了多样化的文档样本,并对其进行了标准化处理。DLUE数据集的应用领域广泛,旨在解决机器在处理长文档时的理解和分析问题,提高机器对复杂文档内容的处理能力。
提供机构:
中国科学院软件研究所
创建时间:
2023-05-16



