Atipico1/mrqa_v2_unans
收藏Hugging Face2024-02-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Atipico1/mrqa_v2_unans
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个预处理过的问答数据集,包含多个特征,如问题的ID、问题文本、答案、掩码查询、上下文、答案句子、答案在上下文中的位置、查询嵌入以及与查询和上下文相关的相似上下文信息。数据集分为一个训练集,包含203,281个示例,总大小为1,271,622,097.58字节。下载大小为1,124,157,534字节。
该数据集是一个预处理过的问答数据集,包含多个特征,如问题的ID、问题文本、答案、掩码查询、上下文、答案句子、答案在上下文中的位置、查询嵌入以及与查询和上下文相关的相似上下文信息。数据集分为一个训练集,包含203,281个示例,总大小为1,271,622,097.58字节。下载大小为1,124,157,534字节。
提供机构:
Atipico1
原始信息汇总
数据集概述
数据集特征
- subset: 字符串类型
- qid: 字符串类型
- question: 字符串类型
- answers: 字符串序列
- masked_query: 字符串类型
- context: 字符串类型
- answer_sent: 字符串类型
- answer_in_context: 字符串序列
- query_embedding: 浮点数序列
- Q_similar_context: 字符串类型
- C_similar_context: 字符串类型
- QC_similar_context: 字符串类型
- random_context: 字符串类型
数据集分割
- train: 包含203281个样本,占用1271622097.5756857字节
数据集大小
- 下载大小: 1124157534字节
- 数据集大小: 1271622097.5756857字节
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*



