mekaneeky/ateso-crowd-validated-paths
收藏Hugging Face2023-08-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/mekaneeky/ateso-crowd-validated-paths
下载链接
链接失效反馈官方服务:
资源简介:
---
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
- split: valid
path: data/valid-*
- split: test
path: data/test-*
dataset_info:
features:
- name: Path
dtype: string
- name: Key
dtype: int64
- name: Speaker
dtype: string
- name: Transcription
dtype: string
splits:
- name: train
num_bytes: 691846
num_examples: 4829
- name: valid
num_bytes: 14470
num_examples: 100
- name: test
num_bytes: 13881
num_examples: 96
download_size: 274753
dataset_size: 720197
---
# Dataset Card for "ateso-crowd-validated-paths"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
配置项:
- 配置名称:默认(default)
数据文件:
- 拆分集:训练集(train),路径:data/train-*
- 拆分集:验证集(valid),路径:data/valid-*
- 拆分集:测试集(test),路径:data/test-*
数据集信息:
特征:
- 名称:Path,数据类型:字符串(string)
- 名称:Key,数据类型:64位整数(int64)
- 名称:Speaker,数据类型:字符串(string)
- 名称:Transcription,数据类型:字符串(string)
数据集划分:
- 名称:train,字节数:691846,样本数:4829
- 名称:valid,字节数:14470,样本数:100
- 名称:test,字节数:13881,样本数:96
下载总大小:274753,数据集总存储大小:720197
---
# 「ateso-crowd-validated-paths」数据集卡片
[如需补充更多信息,请参阅](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
mekaneeky
原始信息汇总
数据集概述
数据集配置
- 配置名称: default
- 数据文件:
- 训练集: data/train-*
- 验证集: data/valid-*
- 测试集: data/test-*
数据集信息
-
特征:
- Path: 字符串类型
- Key: 64位整数类型
- Speaker: 字符串类型
- Transcription: 字符串类型
-
分割:
- 训练集:
- 字节数: 691846
- 样本数: 4829
- 验证集:
- 字节数: 14470
- 样本数: 100
- 测试集:
- 字节数: 13881
- 样本数: 96
- 训练集:
-
下载大小: 274753 字节
-
数据集大小: 720197 字节



