AdoCleanCode/MSR-VTT-splits-run2
收藏Hugging Face2025-11-19 更新2025-12-20 收录
下载链接:
https://hf-mirror.com/datasets/AdoCleanCode/MSR-VTT-splits-run2
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
features:
- name: text
dtype: string
- name: category
dtype: int64
splits:
- name: general_train
num_bytes: 8602206
num_examples: 144000
- name: general_test
num_bytes: 183331
num_examples: 1800
- name: real_no_shift_train
num_bytes: 8614711
num_examples: 144000
- name: real_no_shift_test
num_bytes: 181970
num_examples: 1800
- name: real_mild_kl03_train
num_bytes: 6202796
num_examples: 104520
- name: real_mild_kl03_test
num_bytes: 131988
num_examples: 1307
- name: real_moderate_kl06_train
num_bytes: 4190237
num_examples: 70400
- name: real_moderate_kl06_test
num_bytes: 89023
num_examples: 880
- name: real_severe_kl08_train
num_bytes: 4025524
num_examples: 67460
- name: real_severe_kl08_test
num_bytes: 83852
num_examples: 844
download_size: 14465646
dataset_size: 32305638
configs:
- config_name: default
data_files:
- split: general_train
path: data/general_train-*
- split: general_test
path: data/general_test-*
- split: real_no_shift_train
path: data/real_no_shift_train-*
- split: real_no_shift_test
path: data/real_no_shift_test-*
- split: real_mild_kl03_train
path: data/real_mild_kl03_train-*
- split: real_mild_kl03_test
path: data/real_mild_kl03_test-*
- split: real_moderate_kl06_train
path: data/real_moderate_kl06_train-*
- split: real_moderate_kl06_test
path: data/real_moderate_kl06_test-*
- split: real_severe_kl08_train
path: data/real_severe_kl08_train-*
- split: real_severe_kl08_test
path: data/real_severe_kl08_test-*
---
数据集信息:
特征:
- 名称: 文本
数据类型: 字符串
- 名称: 类别
数据类型: int64
拆分:
- 名称: 通用训练集
字节数: 8602206
样本数: 144000
- 名称: 通用测试集
字节数: 183331
样本数: 1800
- 名称: 真实无偏移训练集
字节数: 8614711
样本数: 144000
- 名称: 真实无偏移测试集
字节数: 181970
样本数: 1800
- 名称: 真实轻度KL03训练集
字节数: 6202796
样本数: 104520
- 名称: 真实轻度KL03测试集
字节数: 131988
样本数: 1307
- 名称: 真实中度KL06训练集
字节数: 4190237
样本数: 70400
- 名称: 真实中度KL06测试集
字节数: 89023
样本数: 880
- 名称: 真实重度KL08训练集
字节数: 4025524
样本数: 67460
- 名称: 真实重度KL08测试集
字节数: 83852
样本数: 844
下载大小: 14465646
数据集大小: 32305638
配置:
- 配置名称: 默认
数据文件:
- 拆分: 通用训练集
路径: data/general_train-*
- 拆分: 通用测试集
路径: data/general_test-*
- 拆分: 真实无偏移训练集
路径: data/real_no_shift_train-*
- 拆分: 真实无偏移测试集
路径: data/real_no_shift_test-*
- 拆分: 真实轻度KL03训练集
路径: data/real_mild_kl03_train-*
- 拆分: 真实轻度KL03测试集
路径: data/real_mild_kl03_test-*
- 拆分: 真实中度KL06训练集
路径: data/real_moderate_kl06_train-*
- 拆分: 真实中度KL06测试集
路径: data/real_moderate_kl06_test-*
- 拆分: 真实重度KL08训练集
路径: data/real_severe_kl08_train-*
- 拆分: 真实重度KL08测试集
路径: data/real_severe_kl08_test-*
提供机构:
AdoCleanCode



