LiveLongBench
收藏LiveLongBench数据集概述
数据集简介
LiveLongBench是首个基于直播场景的语音长文本数据集,专注于解决自然语言处理中的长上下文理解挑战。该数据集特别针对现实对话中存在的语音元素、高冗余性和信息密度不均等特点设计。
核心特点
- 数据来源:源自真实直播场景的语音文本
- 核心挑战:处理高冗余性、对话性质的现实场景文本
- 应用场景:电子商务和直播领域的实际应用
任务分类
- 检索依赖型任务
- 推理依赖型任务
- 混合型任务
数据集结构
LiveLongBench/ ├── data/ # 数据集文件及预处理脚本 ├── data/results/ # 基准测试结果和评估输出 ├── scripts/ # 模型评估运行脚本 ├── src/ # 模型实现和任务评估源代码 ├── eval/ # "大海捞针"实验代码和资源 ├── pipeline_passkey/ # "大海捞针"任务实验流程
获取方式
- 演示样本:包含在仓库的data/livedata/目录中
- 完整数据集:存储在Google Drive,需通过指定链接申请访问权限
- 访问申请链接:https://drive.google.com/drive/folders/1aWDSOwfeVCNnUqP0ZLo0vsC5soCAlssN?usp=drive_link
引用信息
bibtex @misc{wu2025livelongbench, title={LiveLongBench: Tackling Long-Context Understanding for Spoken Texts from Live Streams}, author={Yongxuan Wu and Runyu Chen and Peiyu Liu and Hongjin Qian}, year={2025}, eprint={2504.17366}, archivePrefix={arXiv}, primaryClass={cs.CL}, url={https://arxiv.org/abs/2504.17366}, }
论文地址:https://arxiv.org/abs/2504.17366

- 1LiveLongBench: Tackling Long-Context Understanding for Spoken Texts from Live Streams北京国际商务与经济大学, 北京人工智能研究院 · 2025年



