大模型多文档复杂问答长文本理解评测数据集

Name: 大模型多文档复杂问答长文本理解评测数据集
Creator: maas
Published: 2026-05-23 14:41:42
License: 暂无描述

魔搭社区2026-05-23 更新2024-09-14 收录

下载链接：

https://modelscope.cn/datasets/iic/Loong

下载链接

链接失效反馈

官方服务：

资源简介：

《Leave No Document Behind: Benchmarking Long-Context LLMs with Extended Multi-Doc QA》

《不遗漏任何文档：基于扩展型多文档问答（Extended Multi-Doc QA）的长上下文大语言模型（Long-Context LLMs）基准测试》

提供机构：

maas

创建时间：

2024-09-10

搜集汇总

数据集介绍

背景与挑战

背景概述

Loong是一个专注于评估大语言模型在多文档长文本理解和复杂问答任务中表现的数据集，覆盖金融、法律和学术领域的中英文文档，设计了多种新型评估任务以全面测试模型的长文本处理能力。数据集特别强调真实场景的模拟，通过'Leave No Document Behind'的设计理念确保评估的全面性和挑战性。

以上内容由遇见数据集搜集并总结生成