Seongill/squad_conflict_all
收藏Hugging Face2023-12-05 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Seongill/squad_conflict_all
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: id
dtype: string
- name: title
dtype: string
- name: context
dtype: string
- name: question
dtype: string
- name: answers
struct:
- name: answer_start
sequence: int64
- name: text
sequence: string
- name: masked_query
dtype: string
- name: query_embedding
sequence: float64
- name: ent_type
dtype: string
- name: rewritten_context
dtype: string
- name: has_answer
dtype: bool
- name: answer
dtype: string
splits:
- name: train
num_bytes: 330405646
num_examples: 42943
download_size: 229666270
dataset_size: 330405646
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集信息:
特征字段:
- 名称:id,数据类型:字符串
- 名称:title,数据类型:字符串
- 名称:context,数据类型:字符串
- 名称:question,数据类型:字符串
- 名称:answers,为结构体类型,包含以下子字段:
- 子字段名:answer_start,数据类型为int64序列
- 子字段名:text,数据类型为字符串序列
- 名称:masked_query(掩码查询),数据类型:字符串
- 名称:query_embedding(查询嵌入),数据类型为float64序列
- 名称:ent_type(实体类型),数据类型:字符串
- 名称:rewritten_context(重写上下文),数据类型:字符串
- 名称:has_answer,数据类型:布尔类型
- 名称:answer,数据类型:字符串
数据集拆分:
- 拆分名称:train,字节占用量:330405646,样本总数:42943
下载总大小:229666270
数据集总存储大小:330405646
配置项:
- 配置名称:default,数据文件配置:
- 对应拆分train的数据文件路径为data/train-*
提供机构:
Seongill
原始信息汇总
数据集概述
数据集信息
特征
- id: 字符串类型
- title: 字符串类型
- context: 字符串类型
- question: 字符串类型
- answers: 结构体类型
- answer_start: 整数序列
- text: 字符串序列
- masked_query: 字符串类型
- query_embedding: 浮点数序列
- ent_type: 字符串类型
- rewritten_context: 字符串类型
- has_answer: 布尔类型
- answer: 字符串类型
数据分割
- train:
- 字节数: 330405646
- 样本数: 42943
数据集大小
- 下载大小: 229666270 字节
- 数据集大小: 330405646 字节
配置
- default:
- 数据文件路径:
data/train-*
- 数据文件路径:



