Atipico1/mrqa-test-final-set-v2-new_question-demon
收藏Hugging Face2024-02-14 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Atipico1/mrqa-test-final-set-v2-new_question-demon
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: subset
dtype: string
- name: qid
dtype: string
- name: question
dtype: string
- name: answers
sequence: string
- name: masked_query
dtype: string
- name: context
dtype: string
- name: answer_sent
dtype: string
- name: answer_in_context
sequence: string
- name: entity
dtype: string
- name: similar_entity
dtype: string
- name: clear_answer_sent
dtype: string
- name: vague_answer_sent
dtype: string
- name: adversary
dtype: string
- name: replace_count
dtype: int64
- name: adversarial_passage
dtype: string
- name: masked_answer_sent
dtype: string
- name: num_mask_token
dtype: int64
- name: entities
sequence: string
- name: gpt_adv_sent
dtype: string
- name: is_same
dtype: string
- name: gpt_adv_sent_passage
dtype: string
- name: gpt_passage
dtype: string
- name: new_question
dtype: string
- name: gpt_adv_sent_passage_demon
dtype: string
splits:
- name: train
num_bytes: 2761084
num_examples: 684
download_size: 1764328
dataset_size: 2761084
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
提供机构:
Atipico1
原始信息汇总
数据集概述
数据特征
数据集包含以下特征:
- subset: 数据子集,类型为字符串。
- qid: 问题ID,类型为字符串。
- question: 问题,类型为字符串。
- answers: 答案序列,类型为字符串序列。
- masked_query: 掩码查询,类型为字符串。
- context: 上下文,类型为字符串。
- answer_sent: 答案句子,类型为字符串。
- answer_in_context: 上下文中的答案序列,类型为字符串序列。
- entity: 实体,类型为字符串。
- similar_entity: 相似实体,类型为字符串。
- clear_answer_sent: 清晰答案句子,类型为字符串。
- vague_answer_sent: 模糊答案句子,类型为字符串。
- adversary: 对抗样本,类型为字符串。
- replace_count: 替换计数,类型为整数。
- adversarial_passage: 对抗性段落,类型为字符串。
- masked_answer_sent: 掩码答案句子,类型为字符串。
- num_mask_token: 掩码标记数量,类型为整数。
- entities: 实体序列,类型为字符串序列。
- gpt_adv_sent: GPT对抗句子,类型为字符串。
- is_same: 是否相同,类型为字符串。
- gpt_adv_sent_passage: GPT对抗句子段落,类型为字符串。
- gpt_passage: GPT段落,类型为字符串。
- new_question: 新问题,类型为字符串。
- gpt_adv_sent_passage_demon: GPT对抗句子段落示例,类型为字符串。
数据分割
- train: 训练集,包含684个样本,占用2761084字节。
数据集大小
- 下载大小: 1764328字节
- 数据集大小: 2761084字节
配置
- default: 默认配置,包含训练集数据文件路径为
data/train-*。



