aleadag/cv2_tags_tagged

Name: aleadag/cv2_tags_tagged
Creator: aleadag
Published: 2024-04-19 02:27:02
License: 暂无描述

Hugging Face2024-04-19 更新2024-06-12 收录

下载链接：

https://hf-mirror.com/datasets/aleadag/cv2_tags_tagged

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含多个特征，如客户端ID、路径、文本、点赞数、点踩数、年龄、性别、口音、地区、片段、语音音高均值、语音音高标准差、信噪比、C50、语速、音素、音高、噪音、混响和语音单调性等。数据集分为训练集、测试集、验证集、其他集和无效集五个部分，每个部分都有相应的字节数和示例数。数据集的下载大小为1732601字节，总大小为4597153字节。

提供机构：

aleadag

原始信息汇总

数据集概述

数据集特征

client_id: 字符串
path: 字符串
text: 字符串
up_votes: 整数
down_votes: 整数
age: 字符串
gender: 字符串
accent: 字符串
locale: 字符串
segment: 字符串
utterance_pitch_mean: 浮点数
utterance_pitch_std: 浮点数
snr: 浮点数
c50: 浮点数
speaking_rate: 字符串
phonemes: 字符串
pitch: 字符串
noise: 字符串
reverberation: 字符串
speech_monotony: 字符串

数据集分割

train: 2301个样本，1517300字节
test: 1950个样本，1271745字节
validation: 1947个样本，1283989字节
other: 19个样本，11864字节
invalidated: 777个样本，512255字节

数据集大小

下载大小: 1732601字节
数据集总大小: 4597153字节

数据文件配置

config_name: default
data_files:
- train: data/train-*
- test: data/test-*
- validation: data/validation-*
- other: data/other-*
- invalidated: data/invalidated-*

5,000+

优质数据集

54 个

任务类型

进入经典数据集