five

DLUE

收藏
arXiv2023-05-16 更新2024-08-06 收录
下载链接:
http://arxiv.org/abs/2305.09520v1
下载链接
链接失效反馈
资源简介:
DLUE数据集是由中国科学院软件研究所创建,旨在全面评估文档理解能力,包括文档分类、结构分析、信息提取和文档转录四个方面。该数据集涵盖多种文档类型和领域,包含10个不同任务的数据集,总计约10,000条数据。创建过程中,研究团队精心选择了多样化的文档样本,并对其进行了标准化处理。DLUE数据集的应用领域广泛,旨在解决机器在处理长文档时的理解和分析问题,提高机器对复杂文档内容的处理能力。
提供机构:
中国科学院软件研究所
创建时间:
2023-05-16
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作