five

anyspeech/fleurs_test

收藏
Hugging Face2023-11-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/anyspeech/fleurs_test
下载链接
链接失效反馈
官方服务:
资源简介:
--- configs: - config_name: default data_files: - split: query path: data/query-* - split: candidate path: data/candidate-* dataset_info: features: - name: _id dtype: int64 - name: file_name dtype: string - name: raw_transcription dtype: string - name: transcription dtype: string - name: num_samples dtype: int64 - name: gender dtype: string - name: phones dtype: string - name: audio struct: - name: array sequence: float64 - name: sampling_rate dtype: int64 splits: - name: query num_bytes: 1843536302 num_examples: 1132 - name: candidate num_bytes: 3243527476 num_examples: 1979 download_size: 3137163451 dataset_size: 5087063778 --- # Dataset Card for "fleurs_test" [More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
anyspeech
原始信息汇总

数据集概述

配置

  • 默认配置
    • 数据文件
      • 查询集:路径为 data/query-*
      • 候选集:路径为 data/candidate-*

数据特征

  • _id:类型为 int64
  • file_name:类型为 string
  • raw_transcription:类型为 string
  • transcription:类型为 string
  • num_samples:类型为 int64
  • gender:类型为 string
  • phones:类型为 string
  • audio:结构包含以下字段:
    • array:序列类型为 float64
    • sampling_rate:类型为 int64

数据分割

  • 查询集
    • 字节数:1843536302
    • 样本数:1132
  • 候选集
    • 字节数:3243527476
    • 样本数:1979

数据大小

  • 下载大小:3137163451 字节
  • 数据集大小:5087063778 字节
搜集汇总
背景与挑战
背景概述
该数据集名为anyspeech/fleurs_test,包含查询和候选两个分割,分别有1132和1979个样本。数据集提供了音频文件、转录文本、性别等特征信息,总大小约为5.09GB。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作