anyspeech/fleurs_test
收藏Hugging Face2023-11-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/anyspeech/fleurs_test
下载链接
链接失效反馈官方服务:
资源简介:
---
configs:
- config_name: default
data_files:
- split: query
path: data/query-*
- split: candidate
path: data/candidate-*
dataset_info:
features:
- name: _id
dtype: int64
- name: file_name
dtype: string
- name: raw_transcription
dtype: string
- name: transcription
dtype: string
- name: num_samples
dtype: int64
- name: gender
dtype: string
- name: phones
dtype: string
- name: audio
struct:
- name: array
sequence: float64
- name: sampling_rate
dtype: int64
splits:
- name: query
num_bytes: 1843536302
num_examples: 1132
- name: candidate
num_bytes: 3243527476
num_examples: 1979
download_size: 3137163451
dataset_size: 5087063778
---
# Dataset Card for "fleurs_test"
[More Information needed](https://github.com/huggingface/datasets/blob/main/CONTRIBUTING.md#how-to-contribute-to-the-dataset-cards)
提供机构:
anyspeech
原始信息汇总
数据集概述
配置
- 默认配置:
- 数据文件:
- 查询集:路径为
data/query-* - 候选集:路径为
data/candidate-*
- 查询集:路径为
- 数据文件:
数据特征
- _id:类型为
int64 - file_name:类型为
string - raw_transcription:类型为
string - transcription:类型为
string - num_samples:类型为
int64 - gender:类型为
string - phones:类型为
string - audio:结构包含以下字段:
- array:序列类型为
float64 - sampling_rate:类型为
int64
- array:序列类型为
数据分割
- 查询集:
- 字节数:1843536302
- 样本数:1132
- 候选集:
- 字节数:3243527476
- 样本数:1979
数据大小
- 下载大小:3137163451 字节
- 数据集大小:5087063778 字节
搜集汇总
背景与挑战
背景概述
该数据集名为anyspeech/fleurs_test,包含查询和候选两个分割,分别有1132和1979个样本。数据集提供了音频文件、转录文本、性别等特征信息,总大小约为5.09GB。
以上内容由遇见数据集搜集并总结生成



