five

大模型多文档复杂问答长文本理解评测数据集

收藏
魔搭社区2026-05-23 更新2024-09-14 收录
下载链接:
https://modelscope.cn/datasets/iic/Loong
下载链接
链接失效反馈
官方服务:
资源简介:
《Leave No Document Behind: Benchmarking Long-Context LLMs with Extended Multi-Doc QA》

《不遗漏任何文档:基于扩展型多文档问答(Extended Multi-Doc QA)的长上下文大语言模型(Long-Context LLMs)基准测试》
提供机构:
maas
创建时间:
2024-09-10
搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
Loong是一个专注于评估大语言模型在多文档长文本理解和复杂问答任务中表现的数据集,覆盖金融、法律和学术领域的中英文文档,设计了多种新型评估任务以全面测试模型的长文本处理能力。数据集特别强调真实场景的模拟,通过'Leave No Document Behind'的设计理念确保评估的全面性和挑战性。
以上内容由遇见数据集搜集并总结生成
二维码
社区交流群
二维码
科研交流群
商业服务