five

Beijuka/Afrikaans_5hr_test

收藏
Hugging Face2024-07-17 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/Beijuka/Afrikaans_5hr_test
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含音频和对应的转录文本信息,特征包括音频、转录文本、音频路径和来源。数据集仅包含测试集,大小为1183474488字节,包含4531个样本。下载大小为1151092955字节。

This dataset includes audio files along with their transcriptions, audio file paths, and source information. The audio files have a sampling rate of 16000Hz. The dataset is divided into a test set containing 4531 samples. The download size of the dataset is 1151092955 bytes, and the total size is 1183474488 bytes.
提供机构:
Beijuka
原始信息汇总

数据集概述

基本信息

  • 名称: Afrikaans_5hr_test
  • 描述: Beijuka/Afrikaans_5hr_test 数据集托管在 HF Mirror 并由 HF Datasets 社区贡献。
  • 别名: Beijuka/Afrikaans_5hr_test
  • 创建者: Bruno
  • URL: https://hf-mirror.com/datasets/Beijuka/Afrikaans_5hr_test

数据集详情

  • 符合标准: http://mlcommons.org/croissant/1.0
  • 关键词:
    • 1K - 10K
    • parquet
    • Audio
    • Text
    • Datasets
    • Dask
    • Croissant
    • 🇺🇸 Region: US

数据分布

  • 类型: cr:FileObject

    • 名称: repo
    • 描述: The HF Mirror git repository.
    • 内容URL: https://hf-mirror.com/datasets/Beijuka/Afrikaans_5hr_test/tree/refs%2Fconvert%2Fparquet
    • 编码格式: git+https
    • SHA256: https://github.com/mlcommons/croissant/issues/80
  • 类型: cr:FileSet

    • 名称: parquet-files-for-config-default
    • 描述: The underlying Parquet files as converted by HF Mirror (see: https://hf-mirror.com/docs/datasets-server/parquet).
    • 包含于: repo
    • 编码格式: application/x-parquet
    • 包含: default//.parquet

记录集

  • 类型: cr:RecordSet

    • 名称: default
    • 描述: Beijuka/Afrikaans_5hr_test - default 子集
      • 1 跳过的列: audio
  • 字段:

    • 名称: default/transcription

      • 描述: Column transcription from the HF Mirror parquet file.
      • 数据类型: sc:Text
      • 来源:
        • 文件集: parquet-files-for-config-default
        • 提取:
          • : transcription
    • 名称: default/audio_path

      • 描述: Column audio_path from the HF Mirror parquet file.
      • 数据类型: sc:Text
      • 来源:
        • 文件集: parquet-files-for-config-default
        • 提取:
          • : audio_path
    • 名称: default/source

      • 描述: Column source from the HF Mirror parquet file.
      • 数据类型: sc:Text
      • 来源:
        • 文件集: parquet-files-for-config-default
        • 提取:
          • : source
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作