five

AIR-Bench/long-doc_law_en

收藏
Hugging Face2024-09-28 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/AIR-Bench/long-doc_law_en
下载链接
链接失效反馈
官方服务:
资源简介:
AIR-Bench_24.04是一个用于文本检索任务的数据集,特别针对长文档检索。该数据集的领域是法律,语言为英语。数据集包含多个分割,每个分割包含查询和语料库文件,分别对应不同的词汇文件范围(如300K-400K、400K-500K等)。

AIR-Bench_24.04是一个用于文本检索任务的数据集,特别针对长文档检索。该数据集的领域是法律,语言为英语。数据集包含多个分割,每个分割包含查询和语料库文件,分别对应不同的词汇文件范围(如300K-400K、400K-500K等)。
提供机构:
AIR-Bench
原始信息汇总

数据集概述

基本信息

  • 语言: 英语
  • 多语言性: 单语种
  • 任务类别: 文本检索
  • 任务ID: 文档检索

配置信息

  • 配置名称: AIR-Bench_24.04
  • 数据文件:
    • 分割: queries_lex_files_300K_400K
      • 路径: "AIR-Bench_24.04/lex_files_300K-400K/queries.jsonl"
    • 分割: corpus_lex_files_300K_400K
      • 路径: "AIR-Bench_24.04/lex_files_300K-400K/corpus.jsonl"
    • 分割: queries_lex_files_400K_500K
      • 路径: "AIR-Bench_24.04/lex_files_400K-500K/queries.jsonl"
    • 分割: corpus_lex_files_400K_500K
      • 路径: "AIR-Bench_24.04/lex_files_400K-500K/corpus.jsonl"
    • 分割: queries_lex_files_500K_600K
      • 路径: "AIR-Bench_24.04/lex_files_500K-600K/queries.jsonl"
    • 分割: corpus_lex_files_500K_600K
      • 路径: "AIR-Bench_24.04/lex_files_500K-600K/corpus.jsonl"
    • 分割: queries_lex_files_600K_700K
      • 路径: "AIR-Bench_24.04/lex_files_600K-700K/queries.jsonl"
    • 分割: corpus_lex_files_600K_700K
      • 路径: "AIR-Bench_24.04/lex_files_600K-700K/corpus.jsonl"

其他信息

  • 可用版本: AIR-Bench_24.04
  • 任务类型: 长文档
  • 领域: 法律
  • 任务名称列表:
    • lex_files_300K-400K
    • lex_files_400K-500K
    • lex_files_500K-600K
    • lex_files_600K-700K
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作