zeio/auto-batch
收藏Hugging Face2023-12-10 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/zeio/auto-batch
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含两个配置:spoken和written。spoken配置包含音频数据,采样率为48000,以及相关的文本信息。written配置仅包含文本数据。两个配置的训练集都包含875140个示例。
提供机构:
zeio
原始信息汇总
数据集概述
配置信息
-
spoken:
- 特征:
title: 类型为字符串。speech: 音频类型,采样率为48000。topics: 列表类型,包含posts列表,每个posts包含text,类型为字符串。
- 分割:
train: 包含875140个样本,总字节数为4378815049786.86。
- 下载大小: 58030117749字节。
- 数据集大小: 4378815049786.86字节。
- 特征:
-
written:
- 特征:
title: 类型为字符串。topics: 列表类型,包含posts列表,每个posts包含text,类型为字符串。
- 分割:
train: 包含875140个样本,总字节数为23170678001。
- 下载大小: 11291624575字节。
- 数据集大小: 23170678001字节。
- 特征:
数据文件路径
-
spoken:
train:spoken/train-*
-
written:
train:written/train-*



