RikRaes/CV_13_FT_75_25_1
收藏Hugging Face2023-09-07 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/RikRaes/CV_13_FT_75_25_1
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个特征字段,如client_id、path、sentence、up_votes、down_votes、age、gender、accents、variant、locale和segment。数据集被分割为train、val和test三个部分,分别包含5000、1000和2000个样本。下载大小为824807117字节,数据集大小为2181128786.099651字节。
提供机构:
RikRaes
原始信息汇总
数据集概述
数据集信息
- 特征列表:
client_id:字符串类型path:结构类型,包含以下子字段:array:浮点数序列path:字符串类型sampling_rate:64位整数类型
sentence:字符串类型up_votes:64位整数类型down_votes:64位整数类型age:字符串类型gender:字符串类型accents:字符串类型variant:空类型locale:字符串类型segment:字符串类型
数据集划分
- 训练集:
- 字节数:1363205491.3122818
- 样本数:5000
- 验证集:
- 字节数:272641098.26245636
- 样本数:1000
- 测试集:
- 字节数:545282196.5249127
- 样本数:2000
数据集大小
- 下载大小:824807117字节
- 数据集大小:2181128786.099651字节



