EACXRLab/echo-mock_data
收藏Hugging Face2024-07-17 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/EACXRLab/echo-mock_data
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含音频文件和相应的文本信息,每个音频文件都有开始时间和结束时间标记。数据集分为训练集和验证集,训练集包含759个样本,验证集包含427个样本。音频文件的总下载大小为722955769字节,数据集总大小为740232442字节。
This dataset includes audio files and corresponding text information, with each audio file marked with start and end times. The dataset is divided into a training set and a validation set, with the training set containing 759 samples and the validation set containing 427 samples. The total download size of the audio files is 722955769 bytes, and the total dataset size is 740232442 bytes.
提供机构:
EACXRLab
原始信息汇总
数据集概述
基本信息
- 名称: echo-mock_data
- 描述: EACXRLab/echo-mock_data 数据集托管在 HF Mirror 并由 HF Datasets 社区贡献。
- 创建者: 欧洲宇航员中心 XR 实验室
- 关键词: 1K - 10K, parquet, Audio, Text, Datasets, Dask, Croissant, 🇺🇸 Region: US
- URL: https://hf-mirror.com/datasets/EACXRLab/echo-mock_data
数据集结构
- 格式: Parquet
- 子集: default
- 分割: train, validation
- 跳过的列: audio
字段信息
- start_time: 来自 HF Mirror Parquet 文件的 start_time 列,数据类型为文本。
- end_time: 来自 HF Mirror Parquet 文件的 end_time 列,数据类型为文本。
- text: 来自 HF Mirror Parquet 文件的 text 列,数据类型为文本。
数据分布
- Git 仓库: 包含 HF Mirror git 仓库,编码格式为 git+https。
- Parquet 文件: 包含由 HF Mirror 转换的底层 Parquet 文件,编码格式为 application/x-parquet。



