sanchit-gandhi/earnings22_robust_split
收藏Hugging Face2022-06-21 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/sanchit-gandhi/earnings22_robust_split
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为earnings22_robust,包含56873行数据,每行数据包含以下特征:source_id, audio, segment_id, sentence, start_ts, end_ts。数据集被分割为训练集、验证集和测试集,比例分别为90%、5%和5%。
提供机构:
sanchit-gandhi
原始信息汇总
数据集概述
数据集名称
- 原始数据集名称:earnings22_robust
- 分割后数据集名称:earnings22_robust_split
数据集结构
-
原始数据集
- 特征:[source_id, audio, segment_id, sentence, start_ts, end_ts]
- 行数:56873
-
分割后数据集
- 训练集
- 特征:[source_id, audio, segment_id, sentence, start_ts, end_ts]
- 行数:51185
- 验证集
- 特征:[source_id, audio, segment_id, sentence, start_ts, end_ts]
- 行数:2844
- 测试集
- 特征:[source_id, audio, segment_id, sentence, start_ts, end_ts]
- 行数:2844
- 训练集
数据集分割详情
- 原始数据集被分割为训练集(90%)、验证集(5%)和测试集(5%)。
- 分割过程包括两次分割和合并,确保数据随机性和一致性。



