Seongill/NQ_conflict_5_full
收藏Hugging Face2023-12-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Seongill/NQ_conflict_5_full
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: question
dtype: string
- name: answers
sequence: string
- name: substitute
dtype: string
- name: ctxs
list:
- name: hasanswer
dtype: bool
- name: id
dtype: string
- name: score
dtype: float64
- name: text
dtype: string
- name: title
dtype: string
- name: is_conflict
dtype: bool
- name: num_replace
dtype: int64
- name: num_answer
dtype: int64
splits:
- name: train
num_bytes: 12189883
num_examples: 3610
download_size: 7222006
dataset_size: 12189883
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集信息:
特征字段:
- 名称:问题(question)
数据类型:字符串
- 名称:答案(answers)
数据类型:字符串序列
- 名称:替换项(substitute)
数据类型:字符串
- 名称:上下文列表(ctxs)
列表项:
- 名称:是否包含答案(hasanswer)
数据类型:布尔型
- 名称:标识符(id)
数据类型:字符串
- 名称:得分(score)
数据类型:64位浮点型(float64)
- 名称:文本(text)
数据类型:字符串
- 名称:标题(title)
数据类型:字符串
- 名称:是否存在冲突(is_conflict)
数据类型:布尔型
- 名称:替换次数(num_replace)
数据类型:64位整型(int64)
- 名称:答案数量(num_answer)
数据类型:64位整型(int64)
数据划分:
- 名称:训练集(train)
字节数:12189883
样本数:3610
下载大小:7222006
数据集总大小:12189883
配置项:
- 配置名称:默认(default)
数据文件:
- 数据划分:训练集(train)
路径:data/train-*
提供机构:
Seongill
原始信息汇总
数据集概述
数据集信息
特征
- question: 类型为字符串。
- answers: 类型为字符串序列。
- substitute: 类型为字符串。
- ctxs: 类型为列表,包含以下子特征:
- hasanswer: 类型为布尔值。
- id: 类型为字符串。
- score: 类型为浮点数(float64)。
- text: 类型为字符串。
- title: 类型为字符串。
- is_conflict: 类型为布尔值。
- num_replace: 类型为整数(int64)。
- num_answer: 类型为整数(int64)。
数据分割
- train: 包含3610个样本,占用12189883字节。
数据大小
- 下载大小: 7222006字节。
- 数据集大小: 12189883字节。
配置
- default: 包含训练数据文件,路径为
data/train-*。
搜集汇总
数据集介绍

背景与挑战
背景概述
该数据集基于Natural Questions(NQ)构建,专注于问答任务中的冲突检测场景,包含3,610个问答对,每个样本标注了答案、替代文本、上下文信息以及冲突标志。数据集以表格和文本形式呈现,适用于自然语言处理中的问答评估和冲突分析研究。
以上内容由遇见数据集搜集并总结生成



