AIR-Bench/long-doc_law_en
收藏Hugging Face2024-09-28 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/AIR-Bench/long-doc_law_en
下载链接
链接失效反馈官方服务:
资源简介:
AIR-Bench_24.04是一个用于文本检索任务的数据集,特别针对长文档检索。该数据集的领域是法律,语言为英语。数据集包含多个分割,每个分割包含查询和语料库文件,分别对应不同的词汇文件范围(如300K-400K、400K-500K等)。
AIR-Bench_24.04是一个用于文本检索任务的数据集,特别针对长文档检索。该数据集的领域是法律,语言为英语。数据集包含多个分割,每个分割包含查询和语料库文件,分别对应不同的词汇文件范围(如300K-400K、400K-500K等)。
提供机构:
AIR-Bench
原始信息汇总
数据集概述
基本信息
- 语言: 英语
- 多语言性: 单语种
- 任务类别: 文本检索
- 任务ID: 文档检索
配置信息
- 配置名称: AIR-Bench_24.04
- 数据文件:
- 分割: queries_lex_files_300K_400K
- 路径: "AIR-Bench_24.04/lex_files_300K-400K/queries.jsonl"
- 分割: corpus_lex_files_300K_400K
- 路径: "AIR-Bench_24.04/lex_files_300K-400K/corpus.jsonl"
- 分割: queries_lex_files_400K_500K
- 路径: "AIR-Bench_24.04/lex_files_400K-500K/queries.jsonl"
- 分割: corpus_lex_files_400K_500K
- 路径: "AIR-Bench_24.04/lex_files_400K-500K/corpus.jsonl"
- 分割: queries_lex_files_500K_600K
- 路径: "AIR-Bench_24.04/lex_files_500K-600K/queries.jsonl"
- 分割: corpus_lex_files_500K_600K
- 路径: "AIR-Bench_24.04/lex_files_500K-600K/corpus.jsonl"
- 分割: queries_lex_files_600K_700K
- 路径: "AIR-Bench_24.04/lex_files_600K-700K/queries.jsonl"
- 分割: corpus_lex_files_600K_700K
- 路径: "AIR-Bench_24.04/lex_files_600K-700K/corpus.jsonl"
- 分割: queries_lex_files_300K_400K
其他信息
- 可用版本: AIR-Bench_24.04
- 任务类型: 长文档
- 领域: 法律
- 任务名称列表:
- lex_files_300K-400K
- lex_files_400K-500K
- lex_files_500K-600K
- lex_files_600K-700K



