five

Atipico1/mrqa_v2_unans

收藏
Hugging Face2024-02-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/Atipico1/mrqa_v2_unans
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个预处理过的问答数据集,包含多个特征,如问题的ID、问题文本、答案、掩码查询、上下文、答案句子、答案在上下文中的位置、查询嵌入以及与查询和上下文相关的相似上下文信息。数据集分为一个训练集,包含203,281个示例,总大小为1,271,622,097.58字节。下载大小为1,124,157,534字节。

该数据集是一个预处理过的问答数据集,包含多个特征,如问题的ID、问题文本、答案、掩码查询、上下文、答案句子、答案在上下文中的位置、查询嵌入以及与查询和上下文相关的相似上下文信息。数据集分为一个训练集,包含203,281个示例,总大小为1,271,622,097.58字节。下载大小为1,124,157,534字节。
提供机构:
Atipico1
原始信息汇总

数据集概述

数据集特征

  • subset: 字符串类型
  • qid: 字符串类型
  • question: 字符串类型
  • answers: 字符串序列
  • masked_query: 字符串类型
  • context: 字符串类型
  • answer_sent: 字符串类型
  • answer_in_context: 字符串序列
  • query_embedding: 浮点数序列
  • Q_similar_context: 字符串类型
  • C_similar_context: 字符串类型
  • QC_similar_context: 字符串类型
  • random_context: 字符串类型

数据集分割

  • train: 包含203281个样本,占用1271622097.5756857字节

数据集大小

  • 下载大小: 1124157534字节
  • 数据集大小: 1271622097.5756857字节

配置

  • config_name: default
  • data_files:
    • split: train
    • path: data/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作