procit002/upto03Jun_only_nl_test_processed_dataset_batch_1
收藏Hugging Face2024-06-03 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/procit002/upto03Jun_only_nl_test_processed_dataset_batch_1
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: ClientId
dtype: string
- name: Client_name
dtype: string
- name: Age
dtype: string
- name: Accent
dtype: string
- name: Language
dtype: string
- name: Text
dtype: string
- name: Audiopath
dtype: string
- name: Gender
dtype: string
- name: audio
dtype: audio
splits:
- name: train
num_bytes: 228204624.875
num_examples: 1121
download_size: 205393198
dataset_size: 228204624.875
configs:
- config_name: default
data_files:
- split: train
path: data/train-*
---
数据集信息(dataset_info):
特征:
- 客户端ID(ClientId):数据类型为字符串
- 客户端名称(Client_name):数据类型为字符串
- 年龄(Age):数据类型为字符串
- 口音(Accent):数据类型为字符串
- 语言(Language):数据类型为字符串
- 文本(Text):数据类型为字符串
- 音频路径(Audiopath):数据类型为字符串
- 性别(Gender):数据类型为字符串
- 音频(audio):数据类型为音频
划分集:
- 训练集(train):字节占用量为228204624.875,样本数量为1121
整体下载大小为205393198,数据集总大小为228204624.875
配置项:
- 默认配置(default):数据文件对应训练集拆分,路径为data/train-*
提供机构:
procit002
原始信息汇总
数据集概述
数据集特征
- ClientId: 数据类型为字符串
- Client_name: 数据类型为字符串
- Age: 数据类型为字符串
- Accent: 数据类型为字符串
- Language: 数据类型为字符串
- Text: 数据类型为字符串
- Audiopath: 数据类型为字符串
- Gender: 数据类型为字符串
- audio: 数据类型为音频
数据集划分
- train:
- 示例数量: 1121
- 数据大小: 228204624.875 字节
数据集大小
- 下载大小: 205393198 字节
- 数据集总大小: 228204624.875 字节
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*



