TeoGchx/BEAT_HML3D_japanese
收藏Hugging Face2024-07-15 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/TeoGchx/BEAT_HML3D_japanese
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含语音、动作、文本和元数据等多种数据类型。语音数据为浮点数序列,动作数据为浮点数序列的序列,文本数据为字符串序列。元数据包括持续时间、名称、帧数、单词数和说话者等信息。数据集分为训练集、测试集、验证集和附加集,分别包含38、18、4和3个样本,总大小为676559371字节。
The dataset includes four main features: speech, motion, text, and meta_data. The speech feature is a sequence of float32, the motion feature is a nested sequence of float32, the text feature is a sequence of string, and the meta_data feature includes duration, name, number of frames, number of words, and speaker information. The dataset is divided into train, test, validation, and additional splits, each with corresponding bytes and number of examples. The download size of the dataset is 1166171881 bytes, and the actual size is 676559371 bytes.
提供机构:
TeoGchx
原始信息汇总
数据集概述
数据集特征
- speech: 序列类型,数据类型为 float32。
- motion: 序列类型,内部序列数据类型为 float32。
- text: 序列类型,数据类型为 string。
- meta_data: 结构类型,包含以下字段:
- duration: 数据类型为 float64。
- name: 数据类型为 string。
- num_frames: 数据类型为 int64。
- num_words: 数据类型为 int64。
- speaker: 数据类型为 string。
数据集分割
- train: 包含 38 个样本,数据大小为 306595845 字节。
- test: 包含 18 个样本,数据大小为 147532954 字节。
- val: 包含 4 个样本,数据大小为 27571170 字节。
- additional: 包含 3 个样本,数据大小为 194859402 字节。
数据集大小
- 下载大小: 1166171881 字节。
- 数据集大小: 676559371 字节。
配置信息
- default 配置包含以下数据文件路径:
- train:
data/train-* - test:
data/test-* - val:
data/val-* - additional:
data/additional-*
- train:



