mteb/cqadupstack-physics
收藏Hugging Face2025-05-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mteb/cqadupstack-physics
下载链接
链接失效反馈官方服务:
资源简介:
CQADupStackPhysicsRetrieval是一个用于社区问答研究的数据集,它包含从社区问答平台提取的问题和答案对,旨在用于文本检索任务,特别是多选问答。数据集由单语种英文构成,并作为MTEB(Massive Text Embedding Benchmark)的一部分。
CQADupStackPhysicsRetrieval is a dataset for community question-answering research, containing question-answer pairs extracted from community question-answering platforms, designed for text retrieval tasks, particularly multiple-choice question answering. The dataset consists of monolingual English and is part of the MTEB (Massive Text Embedding Benchmark).
提供机构:
mteb
原始信息汇总
数据集概述
语言和多语言性
- 语言:英语
- 多语言性:单语种
任务类别和任务ID
- 任务类别:文本检索
- 任务ID:文档检索
配置名称和特征
-
默认配置
- 特征:
- query-id:字符串
- corpus-id:字符串
- score:浮点数(float64)
- 分割:
- 测试集:
- 字节数:50809
- 样本数:1933
- 测试集:
- 特征:
-
语料库配置
- 特征:
- _id:字符串
- title:字符串
- text:字符串
- 分割:
- 语料库:
- 字节数:32038422
- 样本数:38316
- 语料库:
- 特征:
-
查询配置
- 特征:
- _id:字符串
- text:字符串
- 分割:
- 查询集:
- 字节数:69099
- 样本数:1039
- 查询集:
- 特征:
数据文件配置
-
默认配置
- 数据文件:
- 分割:测试集
- 路径:qrels/test.jsonl
- 数据文件:
-
语料库配置
- 数据文件:
- 分割:语料库
- 路径:corpus.jsonl
- 数据文件:
-
查询配置
- 数据文件:
- 分割:查询集
- 路径:queries.jsonl
- 数据文件:



