minh21/COVID-QA-unique-context-test-10-percent-validation-10-percent
收藏Hugging Face2023-09-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/minh21/COVID-QA-unique-context-test-10-percent-validation-10-percent
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: question
dtype: string
- name: answer_text
dtype: string
- name: answer_start
dtype: int64
- name: is_impossible
dtype: bool
- name: document_id
dtype: int64
- name: id
dtype: int64
- name: context
dtype: string
splits:
- name: train
num_bytes: 2050073
num_examples: 1615
- name: test
num_bytes: 260386
num_examples: 202
- name: validation
num_bytes: 261992
num_examples: 202
download_size: 0
dataset_size: 2572451
---
# Dataset Card for "COVID-QA-unique-context-test-10-percent-validation-10-percent"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
---
数据集信息:
特征字段:
- 字段名:问题(question),数据类型:字符串型
- 字段名:答案文本(answer_text),数据类型:字符串型
- 字段名:答案起始位置(answer_start),数据类型:64位整型
- 字段名:是否无解(is_impossible),数据类型:布尔型
- 字段名:文档ID(document_id),数据类型:64位整型
- 字段名:样本ID(id),数据类型:64位整型
- 字段名:上下文(context),数据类型:字符串型
数据集划分:
- 划分名称:训练集(train),字节数:2050073,样本数:1615
- 划分名称:测试集(test),字节数:260386,样本数:202
- 划分名称:验证集(validation),字节数:261992,样本数:202
下载大小:0
数据集总字节数:2572451
---
# 数据集卡片:“COVID-QA-unique-context-test-10-percent-validation-10-percent”
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
minh21
原始信息汇总
数据集概述
数据集信息
特征
- question: 类型为字符串
- answer_text: 类型为字符串
- answer_start: 类型为整数
- is_impossible: 类型为布尔值
- document_id: 类型为整数
- id: 类型为整数
- context: 类型为字符串
数据分割
- train: 包含1615个样本,大小为2050073字节
- test: 包含202个样本,大小为260386字节
- validation: 包含202个样本,大小为261992字节
数据集大小
- 总大小: 2572451字节



