mteb/cqadupstack-mathematica
收藏Hugging Face2025-05-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mteb/cqadupstack-mathematica
下载链接
链接失效反馈官方服务:
资源简介:
CQADupStackMathematicaRetrieval是一个社区问答研究的数据集,专注于数学领域的问题和答案。它包含用于文本检索任务的数据,特别是多选择问答。数据集由MTEB组织提供,用于评估文本嵌入模型。
CQADupStackMathematicaRetrieval is a dataset for community question-answering research, focusing on questions and answers in the field of mathematics. It contains data for text retrieval tasks, particularly multiple-choice question answering. The dataset is provided by MTEB and is used for evaluating text embedding models.
提供机构:
mteb
原始信息汇总
数据集概述
语言和多语言性
- 语言: 英语
- 多语言性: 单语种
任务类别和任务ID
- 任务类别: 文本检索
- 任务ID: 文档检索
配置名称和特征
-
default 配置
- 特征:
- query-id: 字符串
- corpus-id: 字符串
- score: float64
- 分割:
- test:
- 字节数: 34691
- 样本数: 1358
- test:
- 特征:
-
corpus 配置
- 特征:
- _id: 字符串
- title: 字符串
- text: 字符串
- 分割:
- corpus:
- 字节数: 19568620
- 样本数: 16705
- corpus:
- 特征:
-
queries 配置
- 特征:
- _id: 字符串
- text: 字符串
- 分割:
- queries:
- 字节数: 49576
- 样本数: 804
- queries:
- 特征:
数据文件
-
default 配置
- 分割: test
- 路径: qrels/test.jsonl
-
corpus 配置
- 分割: corpus
- 路径: corpus.jsonl
-
queries 配置
- 分割: queries
- 路径: queries.jsonl



