tyzhu/squad_baseline_v4_train_10_eval_10
收藏Hugging Face2023-09-26 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/tyzhu/squad_baseline_v4_train_10_eval_10
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: id
dtype: string
- name: title
dtype: string
- name: context
dtype: string
- name: question
dtype: string
- name: answers
sequence:
- name: text
dtype: string
- name: answer_start
dtype: int32
- name: inputs
dtype: string
- name: targets
dtype: string
splits:
- name: train
num_bytes: 45381
num_examples: 44
- name: validation
num_bytes: 47457
num_examples: 50
download_size: 43725
dataset_size: 92838
---
# Dataset Card for "squad_baseline_v4_train_10_eval_10"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
---
数据集信息:
特征项:
- 标识符(id):数据类型为字符串
- 标题(title):数据类型为字符串
- 上下文(context):数据类型为字符串
- 问题(question):数据类型为字符串
- 答案(answers):序列(sequence)类型,包含以下子字段:
- 答案文本(text):数据类型为字符串
- 答案起始位置(answer_start):数据类型为int32(32位整数)
- 输入文本(inputs):数据类型为字符串
- 目标文本(targets):数据类型为字符串
数据划分:
- 训练集(train):占用字节数45381,包含44个样本
- 验证集(validation):占用字节数47457,包含50个样本
下载大小:43725字节
总数据集大小:92838字节
---
# 「squad_baseline_v4_train_10_eval_10」数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
tyzhu
原始信息汇总
数据集概述
数据集名称
- 名称: squad_baseline_v4_train_10_eval_10
数据集特征
- 特征列表:
- id: 字符串类型
- title: 字符串类型
- context: 字符串类型
- question: 字符串类型
- answers: 序列类型
- text: 字符串类型
- answer_start: 整数类型 (int32)
- inputs: 字符串类型
- targets: 字符串类型
数据集分割
- 训练集:
- 字节数: 45381
- 样本数: 44
- 验证集:
- 字节数: 47457
- 样本数: 50
数据集大小
- 下载大小: 43725
- 数据集大小: 92838



