cnut1648/commonsense_qa_retrieved_by_colbert
收藏Hugging Face2023-05-09 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/cnut1648/commonsense_qa_retrieved_by_colbert
下载链接
链接失效反馈官方服务:
资源简介:
这是CSQA数据集的验证集,每个问题都通过ColBERT v2从MS MARCO Passage Ranking中检索得到。使用特定的参数对训练集的问题部分进行索引,并对验证集的每个问题进行搜索,将结果放入retrieved列中。
提供机构:
cnut1648
原始信息汇总
数据集概述
数据集信息
- 特征列表:
id: 类型为字符串。question: 类型为字符串。question_concept: 类型为字符串。choices: 包含两个子字段:label: 类型为字符串。text: 类型为字符串。
answerKey: 类型为字符串。retrieved: 包含多个子字段:answerKey: 类型为字符串。choices: 包含两个子字段:label: 类型为字符串序列。text: 类型为字符串序列。
passage: 类型为字符串。rank: 类型为整数(int64)。score: 类型为浮点数(float64)。
数据集划分
- 验证集:
- 名称:
validation - 字节数: 2646054
- 样本数: 1221
- 名称:
数据集大小
- 下载大小: 755467 字节
- 数据集大小: 2646054 字节



