Atipico1/nq_test_adversary_conflict_entity
收藏Hugging Face2024-03-18 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/Atipico1/nq_test_adversary_conflict_entity
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
- config_name: conflict
features:
- name: question
dtype: string
- name: answers
sequence: string
- name: ctxs
list:
- name: hasanswer
dtype: bool
- name: score
dtype: float64
- name: text
dtype: string
- name: title
dtype: string
- name: gpt_answer_sentence
dtype: string
- name: gpt_adv_sentence
dtype: string
- name: is_valid_sentence
dtype: bool
- name: gpt_adv_passage
dtype: string
- name: is_valid_passage
dtype: bool
- name: entity_type
dtype: string
- name: similar_entity
dtype: string
- name: similar_entity_score
dtype: float32
- name: random_entity
dtype: string
- name: random_entity_score
dtype: float64
- name: gpt_conflict_sentence
dtype: string
- name: gpt_conflict_passage
dtype: string
- name: is_valid_conflict_passage
dtype: bool
splits:
- name: train
num_bytes: 16260286
num_examples: 3610
download_size: 9671677
dataset_size: 16260286
- config_name: default
features:
- name: question
dtype: string
- name: answers
sequence: string
- name: ctxs
list:
- name: hasanswer
dtype: bool
- name: score
dtype: float64
- name: text
dtype: string
- name: title
dtype: string
- name: gpt_answer_sentence
dtype: string
- name: gpt_adv_sentence
dtype: string
- name: is_valid_sentence
dtype: bool
- name: gpt_adv_passage
dtype: string
- name: is_valid_passage
dtype: bool
- name: entity_type
dtype: string
- name: similar_entity
dtype: string
- name: similar_entity_score
dtype: float32
- name: random_entity
dtype: string
- name: random_entity_score
dtype: float64
splits:
- name: train
num_bytes: 14536867
num_examples: 3610
download_size: 8627352
dataset_size: 14536867
configs:
- config_name: conflict
data_files:
- split: train
path: conflict/train-*
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集信息:
- 配置名称:conflict
特征:
- 字段名:question(问题)
数据类型:字符串(string)
- 字段名:answers(答案)
数据类型:字符串序列(sequence<string>)
- 字段名:ctxs(上下文)
类型:列表,包含以下子字段:
- 字段名:hasanswer(是否包含答案)
数据类型:布尔型(bool)
- 字段名:score(得分)
数据类型:64位浮点数(float64)
- 字段名:text(文本)
数据类型:字符串(string)
- 字段名:title(标题)
数据类型:字符串(string)
- 字段名:gpt_answer_sentence(GPT生成答案语句)
数据类型:字符串(string)
- 字段名:gpt_adv_sentence(GPT生成对抗语句)
数据类型:字符串(string)
- 字段名:is_valid_sentence(语句有效性标识)
数据类型:布尔型(bool)
- 字段名:gpt_adv_passage(GPT生成对抗文本段)
数据类型:字符串(string)
- 字段名:is_valid_passage(文本段有效性标识)
数据类型:布尔型(bool)
- 字段名:entity_type(实体类型)
数据类型:字符串(string)
- 字段名:similar_entity(相似实体)
数据类型:字符串(string)
- 字段名:similar_entity_score(相似实体得分)
数据类型:32位浮点数(float32)
- 字段名:random_entity(随机实体)
数据类型:字符串(string)
- 字段名:random_entity_score(随机实体得分)
数据类型:64位浮点数(float64)
- 字段名:gpt_conflict_sentence(GPT生成冲突语句)
数据类型:字符串(string)
- 字段名:gpt_conflict_passage(GPT生成冲突文本段)
数据类型:字符串(string)
- 字段名:is_valid_conflict_passage(冲突文本段有效性标识)
数据类型:布尔型(bool)
数据集划分:
- 划分名称:train(训练集)
字节大小:16260286
样本数量:3610
下载大小:9671677
数据集总大小:16260286
- 配置名称:default
特征:
- 字段名:question(问题)
数据类型:字符串(string)
- 字段名:answers(答案)
数据类型:字符串序列(sequence<string>)
- 字段名:ctxs(上下文)
类型:列表,包含以下子字段:
- 字段名:hasanswer(是否包含答案)
数据类型:布尔型(bool)
- 字段名:score(得分)
数据类型:64位浮点数(float64)
- 字段名:text(文本)
数据类型:字符串(string)
- 字段名:title(标题)
数据类型:字符串(string)
- 字段名:gpt_answer_sentence(GPT生成答案语句)
数据类型:字符串(string)
- 字段名:gpt_adv_sentence(GPT生成对抗语句)
数据类型:字符串(string)
- 字段名:is_valid_sentence(语句有效性标识)
数据类型:布尔型(bool)
- 字段名:gpt_adv_passage(GPT生成对抗文本段)
数据类型:字符串(string)
- 字段名:is_valid_passage(文本段有效性标识)
数据类型:布尔型(bool)
- 字段名:entity_type(实体类型)
数据类型:字符串(string)
- 字段名:similar_entity(相似实体)
数据类型:字符串(string)
- 字段名:similar_entity_score(相似实体得分)
数据类型:32位浮点数(float32)
- 字段名:random_entity(随机实体)
数据类型:字符串(string)
- 字段名:random_entity_score(随机实体得分)
数据类型:64位浮点数(float64)
- 字段名:gpt_conflict_sentence(GPT生成冲突语句)
数据类型:字符串(string)
- 字段名:gpt_conflict_passage(GPT生成冲突文本段)
数据类型:字符串(string)
- 字段名:is_valid_conflict_passage(冲突文本段有效性标识)
数据类型:布尔型(bool)
数据集划分:
- 划分名称:train(训练集)
字节大小:14536867
样本数量:3610
下载大小:8627352
数据集总大小:14536867
配置项:
- 配置名称:conflict
数据文件:
- 数据划分:train(训练集)
文件路径:conflict/train-*
- 配置名称:default
数据文件:
- 数据划分:train(训练集)
文件路径:data/train-*
提供机构:
Atipico1
原始信息汇总
数据集概述
配置名称:conflict
-
特征信息:
- question: 数据类型为字符串
- answers: 数据类型为字符串序列
- ctxs: 列表类型,包含以下子特征:
- hasanswer: 数据类型为布尔值
- score: 数据类型为float64
- text: 数据类型为字符串
- title: 数据类型为字符串
- gpt_answer_sentence: 数据类型为字符串
- gpt_adv_sentence: 数据类型为字符串
- is_valid_sentence: 数据类型为布尔值
- gpt_adv_passage: 数据类型为字符串
- is_valid_passage: 数据类型为布尔值
- entity_type: 数据类型为字符串
- similar_entity: 数据类型为字符串
- similar_entity_score: 数据类型为float32
- random_entity: 数据类型为字符串
- random_entity_score: 数据类型为float64
- gpt_conflict_sentence: 数据类型为字符串
- gpt_conflict_passage: 数据类型为字符串
- is_valid_conflict_passage: 数据类型为布尔值
-
数据集大小:
- 训练集:
- 字节数:16260286
- 示例数:3610
- 下载大小:9671677
- 训练集:
配置名称:default
-
特征信息:
- question: 数据类型为字符串
- answers: 数据类型为字符串序列
- ctxs: 列表类型,包含以下子特征:
- hasanswer: 数据类型为布尔值
- score: 数据类型为float64
- text: 数据类型为字符串
- title: 数据类型为字符串
- gpt_answer_sentence: 数据类型为字符串
- gpt_adv_sentence: 数据类型为字符串
- is_valid_sentence: 数据类型为布尔值
- gpt_adv_passage: 数据类型为字符串
- is_valid_passage: 数据类型为布尔值
- entity_type: 数据类型为字符串
- similar_entity: 数据类型为字符串
- similar_entity_score: 数据类型为float32
- random_entity: 数据类型为字符串
- random_entity_score: 数据类型为float64
-
数据集大小:
- 训练集:
- 字节数:14536867
- 示例数:3610
- 下载大小:8627352
- 训练集:



