An24/An_Vi_Dataset
收藏Hugging Face2024-06-24 更新2024-06-29 收录
下载链接:
https://hf-mirror.com/datasets/An24/An_Vi_Dataset
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含音频文件及其对应的文本内容,特征包括文件名称、持续时间、文本内容和文件路径。数据集分为训练集、验证集和测试集,分别包含170、36和38个样本,总下载大小为586356151字节,数据集总大小为652615422字节。数据文件的默认配置路径分别为data/train-*、data/validation-*和data/test-*。
This dataset contains audio files along with their corresponding text content, with features including file name, duration, text content, and file path. The dataset is divided into training, validation, and test sets, containing 170, 36, and 38 samples respectively, with a total download size of 586356151 bytes and a total dataset size of 652615422 bytes. The default configuration paths for the data files are data/train-*, data/validation-*, and data/test-*.
提供机构:
An24
原始信息汇总
数据集概述
特征
- file: 文件名,数据类型为字符串。
- duration: 持续时间,数据类型为浮点数。
- text: 文本内容,数据类型为字符串。
- file_path: 文件路径,数据类型为音频。
数据集划分
- train: 训练集,包含170个样本,总大小为445,079,501字节。
- validation: 验证集,包含36个样本,总大小为94,421,360字节。
- test: 测试集,包含38个样本,总大小为113,114,561字节。
数据集大小
- 下载大小: 586,356,151字节
- 数据集总大小: 652,615,422字节
配置
- config_name: default
- data_files:
- train: 路径为
data/train-* - validation: 路径为
data/validation-* - test: 路径为
data/test-*
- train: 路径为
- data_files:



