SKIML-ICL/squad-all_ans
收藏Hugging Face2024-10-01 更新2025-04-26 收录
下载链接:
https://hf-mirror.com/datasets/SKIML-ICL/squad-all_ans
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: subset
dtype: string
- name: context
dtype: string
- name: context_tokens
sequence:
- name: tokens
dtype: string
- name: offsets
dtype: int32
- name: qid
dtype: string
- name: question
dtype: string
- name: question_tokens
sequence:
- name: tokens
dtype: string
- name: offsets
dtype: int32
- name: detected_answers
sequence:
- name: text
dtype: string
- name: char_spans
sequence:
- name: start
dtype: int32
- name: end
dtype: int32
- name: token_spans
sequence:
- name: start
dtype: int32
- name: end
dtype: int32
- name: answers
sequence: string
- name: masked_query
dtype: string
- name: query_embedding
sequence: float32
- name: answer_sentence
dtype: string
- name: entity_type
dtype: string
- name: similar_entity
dtype: string
- name: similar_entity_score
dtype: float32
- name: random_entity
dtype: string
- name: random_entity_score
dtype: float64
- name: conflict_sentence
dtype: string
- name: conflict_context
dtype: string
- name: docs
list:
- name: c_id
dtype: int64
- name: distance
dtype: float32
- name: has_answer
dtype: bool
- name: nli
dtype: string
- name: text
dtype: string
- name: has_answer
dtype: bool
- name: answerable
dtype: string
- name: label
dtype: string
splits:
- name: train
num_bytes: 213530416.03648835
num_examples: 20282
- name: validation
num_bytes: 32429346.189689547
num_examples: 3087
download_size: 170941302
dataset_size: 245959762.2261779
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: validation
path: data/validation-*
---
数据集信息:
特征字段:
- 名称:subset,数据类型:字符串
- 名称:context,数据类型:字符串
- 名称:context_tokens,序列类型,包含子字段:
- 名称:tokens,数据类型:字符串
- 名称:offsets,数据类型:32位整型
- 名称:qid,数据类型:字符串
- 名称:question,数据类型:字符串
- 名称:question_tokens,序列类型,包含子字段:
- 名称:tokens,数据类型:字符串
- 名称:offsets,数据类型:32位整型
- 名称:detected_answers,序列类型,每个答案包含子字段:
- 名称:text,数据类型:字符串
- 名称:char_spans,序列类型,每个跨度包含子字段:
- 名称:start,数据类型:32位整型
- 名称:end,数据类型:32位整型
- 名称:token_spans,序列类型,每个跨度包含子字段:
- 名称:start,数据类型:32位整型
- 名称:end,数据类型:32位整型
- 名称:answers,序列类型:字符串
- 名称:masked_query,数据类型:字符串
- 名称:query_embedding,序列类型:32位浮点型
- 名称:answer_sentence,数据类型:字符串
- 名称:entity_type,数据类型:字符串
- 名称:similar_entity,数据类型:字符串
- 名称:similar_entity_score,数据类型:32位浮点型
- 名称:random_entity,数据类型:字符串
- 名称:random_entity_score,数据类型:64位浮点型
- 名称:conflict_sentence,数据类型:字符串
- 名称:conflict_context,数据类型:字符串
- 名称:docs,列表类型,每个文档包含子字段:
- 名称:c_id,数据类型:64位整型
- 名称:distance,数据类型:32位浮点型
- 名称:has_answer,数据类型:布尔型
- 名称:nli,数据类型:字符串
- 名称:text,数据类型:字符串
- 名称:has_answer,数据类型:布尔型
- 名称:answerable,数据类型:字符串
- 名称:label,数据类型:字符串
数据集划分:
- 名称:train,字节大小:213530416.03648835,样本数量:20282
- 名称:validation,字节大小:32429346.189689547,样本数量:3087
下载总大小:170941302
数据集总大小:245959762.2261779
配置项:
- 配置名称:default,数据文件:
- 划分:train,路径:data/train-*
- 划分:validation,路径:data/validation-*
提供机构:
SKIML-ICL



