five

cnut1648/commonsense_qa_retrieved_by_colbert

收藏
Hugging Face2023-05-09 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/cnut1648/commonsense_qa_retrieved_by_colbert
下载链接
链接失效反馈
官方服务:
资源简介:
这是CSQA数据集的验证集,每个问题都通过ColBERT v2从MS MARCO Passage Ranking中检索得到。使用特定的参数对训练集的问题部分进行索引,并对验证集的每个问题进行搜索,将结果放入retrieved列中。
提供机构:
cnut1648
原始信息汇总

数据集概述

数据集信息

  • 特征列表:
    • id: 类型为字符串。
    • question: 类型为字符串。
    • question_concept: 类型为字符串。
    • choices: 包含两个子字段:
      • label: 类型为字符串。
      • text: 类型为字符串。
    • answerKey: 类型为字符串。
    • retrieved: 包含多个子字段:
      • answerKey: 类型为字符串。
      • choices: 包含两个子字段:
        • label: 类型为字符串序列。
        • text: 类型为字符串序列。
      • passage: 类型为字符串。
      • rank: 类型为整数(int64)。
      • score: 类型为浮点数(float64)。

数据集划分

  • 验证集:
    • 名称: validation
    • 字节数: 2646054
    • 样本数: 1221

数据集大小

  • 下载大小: 755467 字节
  • 数据集大小: 2646054 字节
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作