five

sanchit-gandhi/earnings22_robust_split

收藏
Hugging Face2022-06-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/sanchit-gandhi/earnings22_robust_split
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为earnings22_robust,包含56873行数据,每行数据包含以下特征:source_id, audio, segment_id, sentence, start_ts, end_ts。数据集被分割为训练集、验证集和测试集,比例分别为90%、5%和5%。
提供机构:
sanchit-gandhi
原始信息汇总

数据集概述

数据集名称

  • 原始数据集名称:earnings22_robust
  • 分割后数据集名称:earnings22_robust_split

数据集结构

  • 原始数据集

    • 特征:[source_id, audio, segment_id, sentence, start_ts, end_ts]
    • 行数:56873
  • 分割后数据集

    • 训练集
      • 特征:[source_id, audio, segment_id, sentence, start_ts, end_ts]
      • 行数:51185
    • 验证集
      • 特征:[source_id, audio, segment_id, sentence, start_ts, end_ts]
      • 行数:2844
    • 测试集
      • 特征:[source_id, audio, segment_id, sentence, start_ts, end_ts]
      • 行数:2844

数据集分割详情

  • 原始数据集被分割为训练集(90%)、验证集(5%)和测试集(5%)。
  • 分割过程包括两次分割和合并,确保数据随机性和一致性。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作