zxvix/squad_text_new
收藏Hugging Face2023-10-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/zxvix/squad_text_new
下载链接
链接失效反馈官方服务:
资源简介:
---
configs:
- config_name: default
data_files:
- split: annotated
path: data/annotated-*
- split: augmented
path: data/augmented-*
- split: augmented_2
path: data/augmented_2-*
dataset_info:
features:
- name: text
dtype: string
- name: original_text
dtype: string
splits:
- name: annotated
num_bytes: 3302478
num_examples: 2044
- name: augmented
num_bytes: 3294934
num_examples: 2053
- name: augmented_2
num_bytes: 3274276.7295597484
num_examples: 2054
download_size: 4206194
dataset_size: 9871688.72955975
---
# Dataset Card for "squad_text_new"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
配置项:
- 配置名称:default
数据文件:
- 数据拆分(split):annotated(标注集),路径:data/annotated-*
- 数据拆分(split):augmented(增强集),路径:data/augmented-*
- 数据拆分(split):augmented_2(第二代增强集),路径:data/augmented_2-*
数据集信息(dataset_info):
特征字段:
- 字段名:文本(text),数据类型(dtype):字符串(string)
- 字段名:原始文本(original_text),数据类型(dtype):字符串(string)
数据拆分详情:
- 数据拆分名称:annotated(标注集),字节大小:3302478,样本数量:2044
- 数据拆分名称:augmented(增强集),字节大小:3294934,样本数量:2053
- 数据拆分名称:augmented_2(第二代增强集),字节大小:3274276.7295597484,样本数量:2054
下载总大小:4206194
数据集总大小:9871688.72955975
---
# 「squad_text_new」数据集卡片
[需补充更多信息](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
zxvix
原始信息汇总
数据集概述
数据集名称
- squad_text_new
数据集配置
- 默认配置
数据文件
- 分割: annotated
- 路径: data/annotated-*
- 分割: augmented
- 路径: data/augmented-*
- 分割: augmented_2
- 路径: data/augmented_2-*
数据集信息
特征
- 名称: text
- 数据类型: string
- 名称: original_text
- 数据类型: string
分割
- 名称: annotated
- 字节数: 3302478
- 样本数: 2044
- 名称: augmented
- 字节数: 3294934
- 样本数: 2053
- 名称: augmented_2
- 字节数: 3274276.7295597484
- 样本数: 2054
大小
- 下载大小: 4206194
- 数据集大小: 9871688.72955975



