five

Atipico1/nq_test_adversary_conflict_entity

收藏
Hugging Face2024-03-18 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/Atipico1/nq_test_adversary_conflict_entity
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: - config_name: conflict features: - name: question dtype: string - name: answers sequence: string - name: ctxs list: - name: hasanswer dtype: bool - name: score dtype: float64 - name: text dtype: string - name: title dtype: string - name: gpt_answer_sentence dtype: string - name: gpt_adv_sentence dtype: string - name: is_valid_sentence dtype: bool - name: gpt_adv_passage dtype: string - name: is_valid_passage dtype: bool - name: entity_type dtype: string - name: similar_entity dtype: string - name: similar_entity_score dtype: float32 - name: random_entity dtype: string - name: random_entity_score dtype: float64 - name: gpt_conflict_sentence dtype: string - name: gpt_conflict_passage dtype: string - name: is_valid_conflict_passage dtype: bool splits: - name: train num_bytes: 16260286 num_examples: 3610 download_size: 9671677 dataset_size: 16260286 - config_name: default features: - name: question dtype: string - name: answers sequence: string - name: ctxs list: - name: hasanswer dtype: bool - name: score dtype: float64 - name: text dtype: string - name: title dtype: string - name: gpt_answer_sentence dtype: string - name: gpt_adv_sentence dtype: string - name: is_valid_sentence dtype: bool - name: gpt_adv_passage dtype: string - name: is_valid_passage dtype: bool - name: entity_type dtype: string - name: similar_entity dtype: string - name: similar_entity_score dtype: float32 - name: random_entity dtype: string - name: random_entity_score dtype: float64 splits: - name: train num_bytes: 14536867 num_examples: 3610 download_size: 8627352 dataset_size: 14536867 configs: - config_name: conflict data_files: - split: train path: conflict/train-* - config_name: default data_files: - split: train path: data/train-* ---

数据集信息: - 配置名称:conflict 特征: - 字段名:question(问题) 数据类型:字符串(string) - 字段名:answers(答案) 数据类型:字符串序列(sequence<string>) - 字段名:ctxs(上下文) 类型:列表,包含以下子字段: - 字段名:hasanswer(是否包含答案) 数据类型:布尔型(bool) - 字段名:score(得分) 数据类型:64位浮点数(float64) - 字段名:text(文本) 数据类型:字符串(string) - 字段名:title(标题) 数据类型:字符串(string) - 字段名:gpt_answer_sentence(GPT生成答案语句) 数据类型:字符串(string) - 字段名:gpt_adv_sentence(GPT生成对抗语句) 数据类型:字符串(string) - 字段名:is_valid_sentence(语句有效性标识) 数据类型:布尔型(bool) - 字段名:gpt_adv_passage(GPT生成对抗文本段) 数据类型:字符串(string) - 字段名:is_valid_passage(文本段有效性标识) 数据类型:布尔型(bool) - 字段名:entity_type(实体类型) 数据类型:字符串(string) - 字段名:similar_entity(相似实体) 数据类型:字符串(string) - 字段名:similar_entity_score(相似实体得分) 数据类型:32位浮点数(float32) - 字段名:random_entity(随机实体) 数据类型:字符串(string) - 字段名:random_entity_score(随机实体得分) 数据类型:64位浮点数(float64) - 字段名:gpt_conflict_sentence(GPT生成冲突语句) 数据类型:字符串(string) - 字段名:gpt_conflict_passage(GPT生成冲突文本段) 数据类型:字符串(string) - 字段名:is_valid_conflict_passage(冲突文本段有效性标识) 数据类型:布尔型(bool) 数据集划分: - 划分名称:train(训练集) 字节大小:16260286 样本数量:3610 下载大小:9671677 数据集总大小:16260286 - 配置名称:default 特征: - 字段名:question(问题) 数据类型:字符串(string) - 字段名:answers(答案) 数据类型:字符串序列(sequence<string>) - 字段名:ctxs(上下文) 类型:列表,包含以下子字段: - 字段名:hasanswer(是否包含答案) 数据类型:布尔型(bool) - 字段名:score(得分) 数据类型:64位浮点数(float64) - 字段名:text(文本) 数据类型:字符串(string) - 字段名:title(标题) 数据类型:字符串(string) - 字段名:gpt_answer_sentence(GPT生成答案语句) 数据类型:字符串(string) - 字段名:gpt_adv_sentence(GPT生成对抗语句) 数据类型:字符串(string) - 字段名:is_valid_sentence(语句有效性标识) 数据类型:布尔型(bool) - 字段名:gpt_adv_passage(GPT生成对抗文本段) 数据类型:字符串(string) - 字段名:is_valid_passage(文本段有效性标识) 数据类型:布尔型(bool) - 字段名:entity_type(实体类型) 数据类型:字符串(string) - 字段名:similar_entity(相似实体) 数据类型:字符串(string) - 字段名:similar_entity_score(相似实体得分) 数据类型:32位浮点数(float32) - 字段名:random_entity(随机实体) 数据类型:字符串(string) - 字段名:random_entity_score(随机实体得分) 数据类型:64位浮点数(float64) - 字段名:gpt_conflict_sentence(GPT生成冲突语句) 数据类型:字符串(string) - 字段名:gpt_conflict_passage(GPT生成冲突文本段) 数据类型:字符串(string) - 字段名:is_valid_conflict_passage(冲突文本段有效性标识) 数据类型:布尔型(bool) 数据集划分: - 划分名称:train(训练集) 字节大小:14536867 样本数量:3610 下载大小:8627352 数据集总大小:14536867 配置项: - 配置名称:conflict 数据文件: - 数据划分:train(训练集) 文件路径:conflict/train-* - 配置名称:default 数据文件: - 数据划分:train(训练集) 文件路径:data/train-*
提供机构:
Atipico1
原始信息汇总

数据集概述

配置名称:conflict

  • 特征信息:

    • question: 数据类型为字符串
    • answers: 数据类型为字符串序列
    • ctxs: 列表类型,包含以下子特征:
      • hasanswer: 数据类型为布尔值
      • score: 数据类型为float64
      • text: 数据类型为字符串
      • title: 数据类型为字符串
    • gpt_answer_sentence: 数据类型为字符串
    • gpt_adv_sentence: 数据类型为字符串
    • is_valid_sentence: 数据类型为布尔值
    • gpt_adv_passage: 数据类型为字符串
    • is_valid_passage: 数据类型为布尔值
    • entity_type: 数据类型为字符串
    • similar_entity: 数据类型为字符串
    • similar_entity_score: 数据类型为float32
    • random_entity: 数据类型为字符串
    • random_entity_score: 数据类型为float64
    • gpt_conflict_sentence: 数据类型为字符串
    • gpt_conflict_passage: 数据类型为字符串
    • is_valid_conflict_passage: 数据类型为布尔值
  • 数据集大小:

    • 训练集:
      • 字节数:16260286
      • 示例数:3610
    • 下载大小:9671677

配置名称:default

  • 特征信息:

    • question: 数据类型为字符串
    • answers: 数据类型为字符串序列
    • ctxs: 列表类型,包含以下子特征:
      • hasanswer: 数据类型为布尔值
      • score: 数据类型为float64
      • text: 数据类型为字符串
      • title: 数据类型为字符串
    • gpt_answer_sentence: 数据类型为字符串
    • gpt_adv_sentence: 数据类型为字符串
    • is_valid_sentence: 数据类型为布尔值
    • gpt_adv_passage: 数据类型为字符串
    • is_valid_passage: 数据类型为布尔值
    • entity_type: 数据类型为字符串
    • similar_entity: 数据类型为字符串
    • similar_entity_score: 数据类型为float32
    • random_entity: 数据类型为字符串
    • random_entity_score: 数据类型为float64
  • 数据集大小:

    • 训练集:
      • 字节数:14536867
      • 示例数:3610
    • 下载大小:8627352
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作