mteb/AILA_casedocs
收藏Hugging Face2025-05-04 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/mteb/AILA_casedocs
下载链接
链接失效反馈官方服务:
资源简介:
AILA_casedocs数据集主要用于文本检索任务。数据集包含三个配置:default、corpus和queries。default配置用于测试,包含195个样本;corpus配置包含186个案例文档;queries配置包含50个查询。每个查询描述一个特定情境,任务是从案例文档中检索出与查询最相关或最匹配的文档。数据集来源于https://zenodo.org/records/4063986。
AILA_casedocs数据集主要用于文本检索任务。数据集包含三个配置:default、corpus和queries。default配置用于测试,包含195个样本;corpus配置包含186个案例文档;queries配置包含50个查询。每个查询描述一个特定情境,任务是从案例文档中检索出与查询最相关或最匹配的文档。数据集来源于https://zenodo.org/records/4063986。
提供机构:
mteb
原始信息汇总
数据集概述
基本信息
- 语言: 英语
- 多语言性: 单语种
- 任务类别: 文本检索
- 任务ID: 文档检索
- 配置名称: corpus
- 标签: 文本检索
数据集配置
默认配置
- 特征:
query-id: 字符串类型corpus-id: 字符串类型score: 浮点数类型
- 分割:
test: 示例数量为195
文档配置
- 特征:
_id: 字符串类型title: 字符串类型text: 字符串类型
- 分割:
corpus: 示例数量为186
查询配置
- 特征:
_id: 字符串类型text: 字符串类型
- 分割:
queries: 示例数量为50
数据文件
默认配置
- 分割:
test - 路径:
qrels/test.jsonl
文档配置
- 分割:
corpus - 路径:
corpus.jsonl
查询配置
- 分割:
queries - 路径:
queries.jsonl
数据集任务
- 任务描述: 检索与给定查询最匹配或最相关的案例文档
- 查询集: 包含50个描述特定情况的查询
- 文档集: 包含案例文档



