five

procit002/upto03Jun_only_nl_test_processed_dataset_batch_1

收藏
Hugging Face2024-06-03 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/procit002/upto03Jun_only_nl_test_processed_dataset_batch_1
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: features: - name: ClientId dtype: string - name: Client_name dtype: string - name: Age dtype: string - name: Accent dtype: string - name: Language dtype: string - name: Text dtype: string - name: Audiopath dtype: string - name: Gender dtype: string - name: audio dtype: audio splits: - name: train num_bytes: 228204624.875 num_examples: 1121 download_size: 205393198 dataset_size: 228204624.875 configs: - config_name: default data_files: - split: train path: data/train-* ---

数据集信息(dataset_info): 特征: - 客户端ID(ClientId):数据类型为字符串 - 客户端名称(Client_name):数据类型为字符串 - 年龄(Age):数据类型为字符串 - 口音(Accent):数据类型为字符串 - 语言(Language):数据类型为字符串 - 文本(Text):数据类型为字符串 - 音频路径(Audiopath):数据类型为字符串 - 性别(Gender):数据类型为字符串 - 音频(audio):数据类型为音频 划分集: - 训练集(train):字节占用量为228204624.875,样本数量为1121 整体下载大小为205393198,数据集总大小为228204624.875 配置项: - 默认配置(default):数据文件对应训练集拆分,路径为data/train-*
提供机构:
procit002
原始信息汇总

数据集概述

数据集特征

  • ClientId: 数据类型为字符串
  • Client_name: 数据类型为字符串
  • Age: 数据类型为字符串
  • Accent: 数据类型为字符串
  • Language: 数据类型为字符串
  • Text: 数据类型为字符串
  • Audiopath: 数据类型为字符串
  • Gender: 数据类型为字符串
  • audio: 数据类型为音频

数据集划分

  • train:
    • 示例数量: 1121
    • 数据大小: 228204624.875 字节

数据集大小

  • 下载大小: 205393198 字节
  • 数据集总大小: 228204624.875 字节

配置

  • config_name: default
  • data_files:
    • split: train
    • path: data/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作