Beijuka/clean_NCHLT_test_xh

Name: Beijuka/clean_NCHLT_test_xh
Creator: Beijuka
Published: 2024-07-12 06:51:04
License: 暂无描述

Hugging Face2024-07-12 更新2024-07-13 收录

下载链接：

https://hf-mirror.com/datasets/Beijuka/clean_NCHLT_test_xh

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含多个特征，如Speaker ID、Age、Gender、Location、Audio、MD5Sum、Duration、PDP Score和transcription。音频数据的采样率为16000Hz。数据集只有一个测试集，包含2770个样本，总大小为358513129字节，下载大小为355422403字节。配置信息指定了默认配置下的数据文件路径。

The dataset includes various features such as Speaker ID, Age, Gender, Location, Audio, MD5Sum, Duration, PDP Score, and transcription. The audio feature has a sampling rate of 16000Hz. The dataset is divided into a test set with 2770 samples, totaling 358513129 bytes. The download size of the dataset is 355422403 bytes.

提供机构：

Beijuka

原始信息汇总

数据集概述

数据集特征

Speaker ID: 说话者ID，数据类型为int64。
Age: 年龄，数据类型为int64。
Gender: 性别，数据类型为string。
Location: 位置，数据类型为string。
Audio: 音频数据，包含采样率为16000的音频文件。
MD5Sum: MD5校验和，数据类型为string。
Duration: 音频时长，数据类型为float64。
PDP Score: PDP评分，数据类型为float64。
transcription: 转录文本，数据类型为string。

数据集分割

test: 测试集，包含2770个样本，总大小为358513129.0字节。

数据集大小

下载大小: 355422403字节。
数据集总大小: 358513129.0字节。

配置

config_name: default
- data_files:
  - split: test
  - path: data/test-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集