five

Cafet/comparition

收藏
Hugging Face2024-05-16 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/Cafet/comparition
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含音频和文本数据,主要用于语音识别任务。数据集的特征包括音频文件、句子文本、输入特征、输入长度、标签、参考文本以及多个不同模型的预测结果。数据集仅包含一个验证集,包含187个样本,总大小为66761676字节。

该数据集包含音频和文本数据,主要用于语音识别任务。数据集的特征包括音频文件、句子文本、输入特征、输入长度、标签、参考文本以及多个不同模型的预测结果。数据集仅包含一个验证集,包含187个样本,总大小为66761676字节。
提供机构:
Cafet
原始信息汇总

数据集信息

特征

  • audio:
    • 采样率: 16000
  • sentence:
    • 数据类型: string
  • input_features:
    • 序列类型: float32
  • input_length:
    • 数据类型: int64
  • labels:
    • 序列类型: int64
  • reference:
    • 数据类型: string
  • prediction_whisper_tiny:
    • 数据类型: string
  • prediction_whisper_small:
    • 数据类型: string
  • prediction_w2v_test:
    • 数据类型: string
  • prediction_whisper_large:
    • 数据类型: string

数据分割

  • validation:
    • 字节数: 66761676.0
    • 样本数: 187

数据集大小

  • 下载大小: 65932120
  • 数据集大小: 66761676.0

配置

  • default:
    • 数据文件:
      • 分割: validation
      • 路径: data/validation-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作