SKIML-ICL/mrqa_nq_all-ans_filtered
收藏Hugging Face2024-10-14 更新2025-04-26 收录
下载链接:
https://hf-mirror.com/datasets/SKIML-ICL/mrqa_nq_all-ans_filtered
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: subset
dtype: string
- name: context
dtype: string
- name: context_tokens
sequence:
- name: tokens
dtype: string
- name: offsets
dtype: int32
- name: qid
dtype: string
- name: question
dtype: string
- name: question_tokens
sequence:
- name: tokens
dtype: string
- name: offsets
dtype: int32
- name: detected_answers
sequence:
- name: text
dtype: string
- name: char_spans
sequence:
- name: start
dtype: int32
- name: end
dtype: int32
- name: token_spans
sequence:
- name: start
dtype: int32
- name: end
dtype: int32
- name: answers
sequence: string
- name: masked_query
dtype: string
- name: query_embedding
sequence: float32
- name: answer_sentence
dtype: string
- name: entity_type
dtype: string
- name: similar_entity
dtype: string
- name: similar_entity_score
dtype: float32
- name: random_entity
dtype: string
- name: random_entity_score
dtype: float64
- name: conflict_sentence
dtype: string
- name: conflict_context
dtype: string
- name: docs
list:
- name: c_id
dtype: int64
- name: distance
dtype: float32
- name: has_answer
dtype: bool
- name: nli
dtype: string
- name: text
dtype: string
- name: has_answer
dtype: bool
- name: answerable
dtype: string
- name: label
dtype: string
splits:
- name: train
num_bytes: 193428279
num_examples: 21478
- name: validation
num_bytes: 806885.8577878104
num_examples: 90
download_size: 151364307
dataset_size: 194235164.85778782
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: validation
path: data/validation-*
---
---
数据集信息:
特征:
- 名称:子集
数据类型:字符串
- 名称:上下文
数据类型:字符串
- 名称:上下文Token序列
序列结构:
- 名称:Token
数据类型:字符串
- 名称:偏移量
数据类型:32位整数
- 名称:问题ID
数据类型:字符串
- 名称:问题
数据类型:字符串
- 名称:问题Token序列
序列结构:
- 名称:Token
数据类型:字符串
- 名称:偏移量
数据类型:32位整数
- 名称:检测到的答案序列
序列结构:
- 名称:文本
数据类型:字符串
- 名称:字符跨度序列
序列结构:
- 名称:起始位置
数据类型:32位整数
- 名称:结束位置
数据类型:32位整数
- 名称:Token跨度序列
序列结构:
- 名称:起始位置
数据类型:32位整数
- 名称:结束位置
数据类型:32位整数
- 名称:答案序列
数据类型:字符串序列
- 名称:掩码查询
数据类型:字符串
- 名称:查询嵌入序列
数据类型:32位浮点数序列
- 名称:答案句子
数据类型:字符串
- 名称:实体类型
数据类型:字符串
- 名称:相似实体
数据类型:字符串
- 名称:相似实体得分
数据类型:32位浮点数
- 名称:随机实体
数据类型:字符串
- 名称:随机实体得分
数据类型:64位浮点数
- 名称:冲突句子
数据类型:字符串
- 名称:冲突上下文
数据类型:字符串
- 名称:文档列表
列表结构:
- 名称:文档ID
数据类型:64位整数
- 名称:距离
数据类型:32位浮点数
- 名称:是否包含答案
数据类型:布尔值
- 名称:自然语言推理(NLI)结果
数据类型:字符串
- 名称:文本
数据类型:字符串
- 名称:是否包含答案
数据类型:布尔值
- 名称:可回答性
数据类型:字符串
- 名称:标签
数据类型:字符串
拆分:
- 名称:训练集
字节数:193428279
样本数:21478
- 名称:验证集
字节数:806885.8577878104
样本数:90
下载大小:151364307
数据集大小:194235164.85778782
配置:
- 配置名称:默认
数据文件:
- 拆分:训练集
路径:data/train-*
- 拆分:验证集
路径:data/validation-*
---
提供机构:
SKIML-ICL



