TuanBC/D50_val_datasets
收藏Hugging Face2023-11-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/TuanBC/D50_val_datasets
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征,如key、音频路径、文本路径、文本内容、输入特征和标签,适用于音频和文本相关的机器学习任务。数据集分为训练集,提供了详细的数据大小和示例数量。
该数据集包含多个特征,如key、音频路径、文本路径、文本内容、输入特征和标签,适用于音频和文本相关的机器学习任务。数据集分为训练集,提供了详细的数据大小和示例数量。
提供机构:
TuanBC
原始信息汇总
数据集概述
数据特征
- key: 数据类型为字符串。
- audio_path: 数据类型为字符串。
- text_path: 数据类型为字符串。
- text: 数据类型为字符串。
- input_features: 序列类型,序列数据类型为float32。
- labels: 序列类型,序列数据类型为int64。
数据分割
- train: 包含8522个样本,总字节数为8188711689。
数据集大小
- 下载大小: 1382194960字节。
- 数据集大小: 8188711689字节。
配置信息
- config_name: default
- data_files:
- split: train
- path: data/train-*
- data_files:



