Beijuka/Afrikaans_5hr_test
收藏Hugging Face2024-07-17 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/Beijuka/Afrikaans_5hr_test
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含音频和对应的转录文本信息,特征包括音频、转录文本、音频路径和来源。数据集仅包含测试集,大小为1183474488字节,包含4531个样本。下载大小为1151092955字节。
This dataset includes audio files along with their transcriptions, audio file paths, and source information. The audio files have a sampling rate of 16000Hz. The dataset is divided into a test set containing 4531 samples. The download size of the dataset is 1151092955 bytes, and the total size is 1183474488 bytes.
提供机构:
Beijuka
原始信息汇总
数据集概述
基本信息
- 名称: Afrikaans_5hr_test
- 描述: Beijuka/Afrikaans_5hr_test 数据集托管在 HF Mirror 并由 HF Datasets 社区贡献。
- 别名: Beijuka/Afrikaans_5hr_test
- 创建者: Bruno
- URL: https://hf-mirror.com/datasets/Beijuka/Afrikaans_5hr_test
数据集详情
- 符合标准: http://mlcommons.org/croissant/1.0
- 关键词:
- 1K - 10K
- parquet
- Audio
- Text
- Datasets
- Dask
- Croissant
- 🇺🇸 Region: US
数据分布
-
类型: cr:FileObject
- 名称: repo
- 描述: The HF Mirror git repository.
- 内容URL: https://hf-mirror.com/datasets/Beijuka/Afrikaans_5hr_test/tree/refs%2Fconvert%2Fparquet
- 编码格式: git+https
- SHA256: https://github.com/mlcommons/croissant/issues/80
-
类型: cr:FileSet
- 名称: parquet-files-for-config-default
- 描述: The underlying Parquet files as converted by HF Mirror (see: https://hf-mirror.com/docs/datasets-server/parquet).
- 包含于: repo
- 编码格式: application/x-parquet
- 包含: default//.parquet
记录集
-
类型: cr:RecordSet
- 名称: default
- 描述: Beijuka/Afrikaans_5hr_test - default 子集
- 1 跳过的列: audio
-
字段:
-
名称: default/transcription
- 描述: Column transcription from the HF Mirror parquet file.
- 数据类型: sc:Text
- 来源:
- 文件集: parquet-files-for-config-default
- 提取:
- 列: transcription
-
名称: default/audio_path
- 描述: Column audio_path from the HF Mirror parquet file.
- 数据类型: sc:Text
- 来源:
- 文件集: parquet-files-for-config-default
- 提取:
- 列: audio_path
-
名称: default/source
- 描述: Column source from the HF Mirror parquet file.
- 数据类型: sc:Text
- 来源:
- 文件集: parquet-files-for-config-default
- 提取:
- 列: source
-



