five

Atipico1/incontext_squad_no_filter

收藏
Hugging Face2024-05-22 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Atipico1/incontext_squad_no_filter
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含多个配置,每个配置具有不同的特征,如id、标题、上下文、问题、答案、掩码查询、查询嵌入、提示、输入、答案句子、命名实体、对抗性句子、相似性等。数据集主要用于问答系统、对抗性训练、冲突检测等自然语言处理任务。

该数据集包含多个配置,每个配置具有不同的特征,如id、标题、上下文、问题、答案、掩码查询、查询嵌入、提示、输入、答案句子、命名实体、对抗性句子、相似性等。数据集主要用于问答系统、对抗性训练、冲突检测等自然语言处理任务。
提供机构:
Atipico1
原始信息汇总

数据集概述

配置名称:adversarial

  • 特征:
    • id: 字符串
    • title: 字符串
    • context: 字符串
    • question: 字符串
    • answers: 序列
      • text: 字符串
      • answer_start: 整数
    • masked_query: 字符串
    • query_embedding: 序列,浮点数
    • prompt: 字符串
    • input: 字符串
    • answer_sentence: 字符串
    • named_entities: 序列,字符串
    • adversarial_sentence: 字符串
    • similarity: 浮点数
  • 分割:
    • train:
      • 字节数: 175526913.85332695
      • 示例数: 29482
  • 下载大小: 133982778
  • 数据集大小: 175526913.85332695

配置名称:adversarial_passage

  • 特征:
    • id: 字符串
    • title: 字符串
    • context: 字符串
    • question: 字符串
    • answers: 序列
      • text: 字符串
      • answer_start: 整数
    • masked_query: 字符串
    • query_embedding: 序列,浮点数
    • answer_sentence: 字符串
    • named_entities: 序列,字符串
    • adversarial_sentence: 字符串
    • prompt: 字符串
    • input: 字符串
    • adversarial_passage: 字符串
  • 分割:
    • train:
      • 字节数: 294242031.0098829
      • 示例数: 39176
  • 下载大小: 206595274
  • 数据集大小: 294242031.0098829

配置名称:answer_sentence

  • 特征:
    • id: 字符串
    • title: 字符串
    • context: 字符串
    • question: 字符串
    • answers: 序列
      • text: 字符串
      • answer_start: 整数
    • masked_query: 字符串
    • query_embedding: 序列,浮点数
    • prompt: 字符串
    • input: 字符串
    • answer_sentence: 字符串
  • 分割:
    • train:
      • 字节数: 384171456
      • 示例数: 73863
  • 下载大小: 307498130
  • 数据集大小: 384171456

配置名称:conflict

  • 特征:
    • id: 字符串
    • title: 字符串
    • context: 字符串
    • question: 字符串
    • answers: 序列
      • text: 字符串
      • answer_start: 整数
    • masked_query: 字符串
    • query_embedding: 序列,浮点数
    • prompt: 字符串
    • input: 字符串
    • answer_sentence: 字符串
    • entity_type: 字符串
    • similar_entity: 字符串
    • similar_entity_score: 浮点数
    • random_entity: 字符串
    • random_entity_score: 双精度浮点数
    • conflict_sentence: 字符串
    • conflict_passage: 字符串
    • conflict_context: 字符串
    • normal_context: 字符串
  • 分割:
    • train:
      • 字节数: 188403125
      • 示例数: 22592
  • 下载大小: 132956327
  • 数据集大小: 188403125

配置名称:default

  • 特征:
    • id: 字符串
    • title: 字符串
    • context: 字符串
    • question: 字符串
    • answers: 序列
      • text: 字符串
      • answer_start: 整数
    • masked_query: 字符串
    • query_embedding: 序列,浮点数
  • 分割:
    • train:
      • 字节数: 290349952
      • 示例数: 73863
  • 下载大小: 287156848
  • 数据集大小: 290349952

配置名称:squad

  • 特征:
    • id: 字符串
    • title: 字符串
    • context: 字符串
    • question: 字符串
    • answers: 序列
      • text: 字符串
      • answer_start: 整数
    • masked_query: 字符串
    • query_embedding: 序列,浮点数
  • 分割:
    • train:
      • 字节数: 148471437
      • 示例数: 38090
  • 下载大小: 147024150
  • 数据集大小: 148471437

配置名称:unanswerable

  • 特征:
    • id: 字符串
    • title: 字符串
    • context: 字符串
    • question: 字符串
    • answers: 序列
      • text: 字符串
      • answer_start: 整数
    • masked_query: 字符串
    • query_embedding: 序列,浮点数
    • similar_context: 字符串
    • random_context: 字符串
  • 分割:
    • train:
      • 字节数: 380998923.0
      • 示例数: 73863
  • 下载大小: 343361090
  • 数据集大小: 380998923.0
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作