cnut1648/openbookqa_retrieved_by_colbert
收藏Hugging Face2023-05-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/cnut1648/openbookqa_retrieved_by_colbert
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为openbookqa_retrieved_by_colbert,是从OBQA的main/test集获取的,每个问题都通过ColBERT v2从MS MARCO Passage Ranking中检索得到。数据集包含id、question_stem、choices、answerKey和retrieved等特征,其中retrieved字段包含从ColBERT v2模型检索到的详细信息。数据集的分割为test,包含500个例子,文件大小为1096660字节。检索过程中使用了特定的参数设置,如doc_maxlen=30和nbits=2,并对每个测试集问题进行了k=10的搜索。
该数据集名为openbookqa_retrieved_by_colbert,是从OBQA的main/test集获取的,每个问题都通过ColBERT v2从MS MARCO Passage Ranking中检索得到。数据集包含id、question_stem、choices、answerKey和retrieved等特征,其中retrieved字段包含从ColBERT v2模型检索到的详细信息。数据集的分割为test,包含500个例子,文件大小为1096660字节。检索过程中使用了特定的参数设置,如doc_maxlen=30和nbits=2,并对每个测试集问题进行了k=10的搜索。
提供机构:
cnut1648
原始信息汇总
数据集概述
数据集名称
- 名称: openbookqa_retrieved_by_colbert
数据集特征
- id: 字符串类型
- question_stem: 字符串类型
- choices: 结构化数据,包含:
- text: 字符串类型
- label: 字符串类型
- answerKey: 字符串类型
- retrieved: 列表类型,包含:
- answerKey: 字符串类型
- choices: 结构化数据,包含:
- label: 字符串类型
- text: 字符串类型
- passage: 字符串类型
- rank: 整数类型(int64)
- score: 浮点数类型(float64)
数据集拆分
- test:
- num_bytes: 1096660字节
- num_examples: 500个样本
数据集大小
- download_size: 220149字节
- dataset_size: 1096660字节



