five

SyedAunZaidi/cv-corpus

收藏
Hugging Face2023-12-12 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/SyedAunZaidi/cv-corpus
下载链接
链接失效反馈
官方服务:
资源简介:
--- dataset_info: config_name: cv-corpus-15.0/ur features: - name: audio dtype: audio - name: client_id dtype: string - name: path dtype: string - name: sentence dtype: string - name: up_votes dtype: string - name: down_votes dtype: string - name: age dtype: string - name: gender dtype: string - name: accents dtype: string - name: variant dtype: float64 - name: locale dtype: string - name: segment dtype: float64 - name: file dtype: string splits: - name: train num_bytes: 134170569.356 num_examples: 5324 - name: validation num_bytes: 101371187.16 num_examples: 3990 - name: test num_bytes: 107856086.014 num_examples: 4031 download_size: 342919418 dataset_size: 343397842.53 configs: - config_name: cv-corpus-15.0/ur data_files: - split: train path: cv-corpus-15.0/ur/train-* - split: validation path: cv-corpus-15.0/ur/validation-* - split: test path: cv-corpus-15.0/ur/test-* ---
提供机构:
SyedAunZaidi
原始信息汇总

数据集概述

配置名称

  • cv-corpus-15.0/ur

特征信息

  • 音频: audio
  • 客户端ID: client_id (字符串)
  • 路径: path (字符串)
  • 句子: sentence (字符串)
  • 赞数: up_votes (字符串)
  • 踩数: down_votes (字符串)
  • 年龄: age (字符串)
  • 性别: gender (字符串)
  • 口音: accents (字符串)
  • 变体: variant (浮点数)
  • 地区: locale (字符串)
  • : segment (浮点数)
  • 文件: file (字符串)

数据分割

  • 训练集:
    • 字节数: 134170569.356
    • 样本数: 5324
  • 验证集:
    • 字节数: 101371187.16
    • 样本数: 3990
  • 测试集:
    • 字节数: 107856086.014
    • 样本数: 4031

数据大小

  • 下载大小: 342919418 字节
  • 数据集大小: 343397842.53 字节

配置详情

  • 配置名称: cv-corpus-15.0/ur
  • 数据文件路径:
    • 训练集: cv-corpus-15.0/ur/train-*
    • 验证集: cv-corpus-15.0/ur/validation-*
    • 测试集: cv-corpus-15.0/ur/test-*
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作