five

cnut1648/openbookqa_retrieved_by_colbert

收藏
Hugging Face2023-05-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/cnut1648/openbookqa_retrieved_by_colbert
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为openbookqa_retrieved_by_colbert,是从OBQA的main/test集获取的,每个问题都通过ColBERT v2从MS MARCO Passage Ranking中检索得到。数据集包含id、question_stem、choices、answerKey和retrieved等特征,其中retrieved字段包含从ColBERT v2模型检索到的详细信息。数据集的分割为test,包含500个例子,文件大小为1096660字节。检索过程中使用了特定的参数设置,如doc_maxlen=30和nbits=2,并对每个测试集问题进行了k=10的搜索。

该数据集名为openbookqa_retrieved_by_colbert,是从OBQA的main/test集获取的,每个问题都通过ColBERT v2从MS MARCO Passage Ranking中检索得到。数据集包含id、question_stem、choices、answerKey和retrieved等特征,其中retrieved字段包含从ColBERT v2模型检索到的详细信息。数据集的分割为test,包含500个例子,文件大小为1096660字节。检索过程中使用了特定的参数设置,如doc_maxlen=30和nbits=2,并对每个测试集问题进行了k=10的搜索。
提供机构:
cnut1648
原始信息汇总

数据集概述

数据集名称

  • 名称: openbookqa_retrieved_by_colbert

数据集特征

  • id: 字符串类型
  • question_stem: 字符串类型
  • choices: 结构化数据,包含:
    • text: 字符串类型
    • label: 字符串类型
  • answerKey: 字符串类型
  • retrieved: 列表类型,包含:
    • answerKey: 字符串类型
    • choices: 结构化数据,包含:
      • label: 字符串类型
      • text: 字符串类型
    • passage: 字符串类型
    • rank: 整数类型(int64)
    • score: 浮点数类型(float64)

数据集拆分

  • test:
    • num_bytes: 1096660字节
    • num_examples: 500个样本

数据集大小

  • download_size: 220149字节
  • dataset_size: 1096660字节
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作