mbzuai-ugrip-statement-tuning/flores_101_31_langs
收藏Hugging Face2024-07-25 更新2025-04-12 收录
下载链接:
https://hf-mirror.com/datasets/mbzuai-ugrip-statement-tuning/flores_101_31_langs
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
- config_name: af
features:
- name: label
dtype: int64
- name: statement
dtype: string
splits:
- name: train
num_bytes: 9191562
num_examples: 23928
download_size: 4587966
dataset_size: 9191562
- config_name: ar
features:
- name: label
dtype: int64
- name: statement
dtype: string
splits:
- name: train
num_bytes: 10652881
num_examples: 23928
download_size: 5186405
dataset_size: 10652881
- config_name: de
features:
- name: label
dtype: int64
- name: statement
dtype: string
splits:
- name: train
num_bytes: 9454467
num_examples: 23928
download_size: 4841701
dataset_size: 9454467
- config_name: en
features:
- name: label
dtype: int64
- name: statement
dtype: string
splits:
- name: train
num_bytes: 8933740
num_examples: 23928
download_size: 4453158
dataset_size: 8933740
- config_name: es
features:
- name: label
dtype: int64
- name: statement
dtype: string
splits:
- name: train
num_bytes: 9554575
num_examples: 23928
download_size: 4887854
dataset_size: 9554575
- config_name: fr
features:
- name: label
dtype: int64
- name: statement
dtype: string
splits:
- name: train
num_bytes: 13555798
num_examples: 33898
download_size: 6913746
dataset_size: 13555798
- config_name: ga
features:
- name: label
dtype: int64
- name: statement
dtype: string
splits:
- name: train
num_bytes: 9565994
num_examples: 23928
download_size: 4909131
dataset_size: 9565994
- config_name: gu
features:
- name: label
dtype: int64
- name: statement
dtype: string
splits:
- name: train
num_bytes: 13322915
num_examples: 23928
download_size: 5780133
dataset_size: 13322915
- config_name: ha
features:
- name: label
dtype: int64
- name: statement
dtype: string
splits:
- name: train
num_bytes: 9148474
num_examples: 23928
download_size: 4587902
dataset_size: 9148474
- config_name: hi
features:
- name: label
dtype: int64
- name: statement
dtype: string
splits:
- name: train
num_bytes: 13424738
num_examples: 23928
download_size: 5783764
dataset_size: 13424738
- config_name: id
features:
- name: label
dtype: int64
- name: statement
dtype: string
splits:
- name: train
num_bytes: 9249255
num_examples: 23928
download_size: 4507895
dataset_size: 9249255
- config_name: ig
features:
- name: label
dtype: int64
- name: statement
dtype: string
splits:
- name: train
num_bytes: 9412177
num_examples: 23928
download_size: 4632009
dataset_size: 9412177
- config_name: is
features: []
splits:
- name: train
num_bytes: 0
num_examples: 0
download_size: 324
dataset_size: 0
- config_name: kk
features:
- name: label
dtype: int64
- name: statement
dtype: string
splits:
- name: train
num_bytes: 11495748
num_examples: 23928
download_size: 5431977
dataset_size: 11495748
- config_name: ku
features: []
splits:
- name: train
num_bytes: 0
num_examples: 0
download_size: 324
dataset_size: 0
- config_name: ky
features:
- name: label
dtype: int64
- name: statement
dtype: string
splits:
- name: train
num_bytes: 11457298
num_examples: 23928
download_size: 5476066
dataset_size: 11457298
- config_name: la
features: []
splits:
- name: train
num_bytes: 0
num_examples: 0
download_size: 324
dataset_size: 0
- config_name: lb
features:
- name: label
dtype: int64
- name: statement
dtype: string
splits:
- name: train
num_bytes: 9529945
num_examples: 23928
download_size: 4770042
dataset_size: 9529945
- config_name: lo
features:
- name: label
dtype: int64
- name: statement
dtype: string
splits:
- name: train
num_bytes: 13894006
num_examples: 23928
download_size: 5990302
dataset_size: 13894006
- config_name: lv
features:
- name: label
dtype: int64
- name: statement
dtype: string
splits:
- name: train
num_bytes: 9307094
num_examples: 23928
download_size: 4829297
dataset_size: 9307094
- config_name: mt
features:
- name: label
dtype: int64
- name: statement
dtype: string
splits:
- name: train
num_bytes: 9398507
num_examples: 23928
download_size: 4792072
dataset_size: 9398507
- config_name: ny
features:
- name: label
dtype: int64
- name: statement
dtype: string
splits:
- name: train
num_bytes: 9288861
num_examples: 23928
download_size: 4603939
dataset_size: 9288861
- config_name: pt
features:
- name: label
dtype: int64
- name: statement
dtype: string
splits:
- name: train
num_bytes: 9348131
num_examples: 23928
download_size: 4708195
dataset_size: 9348131
- config_name: ru
features:
- name: label
dtype: int64
- name: statement
dtype: string
splits:
- name: train
num_bytes: 11866624
num_examples: 23928
download_size: 5804852
dataset_size: 11866624
- config_name: si
features: []
splits:
- name: train
num_bytes: 0
num_examples: 0
download_size: 324
dataset_size: 0
- config_name: sq
features: []
splits:
- name: train
num_bytes: 0
num_examples: 0
download_size: 324
dataset_size: 0
- config_name: sw
features:
- name: label
dtype: int64
- name: statement
dtype: string
splits:
- name: train
num_bytes: 9079584
num_examples: 23928
download_size: 4509926
dataset_size: 9079584
- config_name: tr
features:
- name: label
dtype: int64
- name: statement
dtype: string
splits:
- name: train
num_bytes: 9284450
num_examples: 23928
download_size: 4709134
dataset_size: 9284450
- config_name: vi
features:
- name: label
dtype: int64
- name: statement
dtype: string
splits:
- name: train
num_bytes: 10146700
num_examples: 23928
download_size: 4925278
dataset_size: 10146700
- config_name: yi
features: []
splits:
- name: train
num_bytes: 0
num_examples: 0
download_size: 324
dataset_size: 0
- config_name: zh
features:
- name: label
dtype: int64
- name: statement
dtype: string
splits:
- name: train
num_bytes: 8759021
num_examples: 23928
download_size: 4612879
dataset_size: 8759021
configs:
- config_name: af
data_files:
- split: train
path: af/train-*
- config_name: ar
data_files:
- split: train
path: ar/train-*
- config_name: de
data_files:
- split: train
path: de/train-*
- config_name: en
data_files:
- split: train
path: en/train-*
- config_name: es
data_files:
- split: train
path: es/train-*
- config_name: fr
data_files:
- split: train
path: fr/train-*
- config_name: ga
data_files:
- split: train
path: ga/train-*
- config_name: gu
data_files:
- split: train
path: gu/train-*
- config_name: ha
data_files:
- split: train
path: ha/train-*
- config_name: hi
data_files:
- split: train
path: hi/train-*
- config_name: id
data_files:
- split: train
path: id/train-*
- config_name: ig
data_files:
- split: train
path: ig/train-*
- config_name: is
data_files:
- split: train
path: is/train-*
- config_name: kk
data_files:
- split: train
path: kk/train-*
- config_name: ku
data_files:
- split: train
path: ku/train-*
- config_name: ky
data_files:
- split: train
path: ky/train-*
- config_name: la
data_files:
- split: train
path: la/train-*
- config_name: lb
data_files:
- split: train
path: lb/train-*
- config_name: lo
data_files:
- split: train
path: lo/train-*
- config_name: lv
data_files:
- split: train
path: lv/train-*
- config_name: mt
data_files:
- split: train
path: mt/train-*
- config_name: ny
data_files:
- split: train
path: ny/train-*
- config_name: pt
data_files:
- split: train
path: pt/train-*
- config_name: ru
data_files:
- split: train
path: ru/train-*
- config_name: si
data_files:
- split: train
path: si/train-*
- config_name: sq
data_files:
- split: train
path: sq/train-*
- config_name: sw
data_files:
- split: train
path: sw/train-*
- config_name: tr
data_files:
- split: train
path: tr/train-*
- config_name: vi
data_files:
- split: train
path: vi/train-*
- config_name: yi
data_files:
- split: train
path: yi/train-*
- config_name: zh
data_files:
- split: train
path: zh/train-*
---
数据集信息:
- 配置名称: af
特征:
- 名称: label
数据类型: int64
- 名称: statement
数据类型: string
拆分:
- 名称: train
字节数: 9191562
样本数: 23928
下载大小: 4587966
数据集大小: 9191562
- 配置名称: ar
特征:
- 名称: label
数据类型: int64
- 名称: statement
数据类型: string
拆分:
- 名称: train
字节数: 10652881
样本数: 23928
下载大小: 5186405
数据集大小: 10652881
- 配置名称: de
特征:
- 名称: label
数据类型: int64
- 名称: statement
数据类型: string
拆分:
- 名称: train
字节数: 9454467
样本数: 23928
下载大小: 4841701
数据集大小: 9454467
- 配置名称: en
特征:
- 名称: label
数据类型: int64
- 名称: statement
数据类型: string
拆分:
- 名称: train
字节数: 8933740
样本数: 23928
下载大小: 4453158
数据集大小: 8933740
- 配置名称: es
特征:
- 名称: label
数据类型: int64
- 名称: statement
数据类型: string
拆分:
- 名称: train
字节数: 9554575
样本数: 23928
下载大小: 4887854
数据集大小: 9554575
- 配置名称: fr
特征:
- 名称: label
数据类型: int64
- 名称: statement
数据类型: string
拆分:
- 名称: train
字节数: 13555798
样本数: 33898
下载大小: 6913746
数据集大小: 13555798
- 配置名称: ga
特征:
- 名称: label
数据类型: int64
- 名称: statement
数据类型: string
拆分:
- 名称: train
字节数: 9565994
样本数: 23928
下载大小: 4909131
数据集大小: 9565994
- 配置名称: gu
特征:
- 名称: label
数据类型: int64
- 名称: statement
数据类型: string
拆分:
- 名称: train
字节数: 13322915
样本数: 23928
下载大小: 5780133
数据集大小: 13322915
- 配置名称: ha
特征:
- 名称: label
数据类型: int64
- 名称: statement
数据类型: string
拆分:
- 名称: train
字节数: 9148474
样本数: 23928
下载大小: 4587902
数据集大小: 9148474
- 配置名称: hi
特征:
- 名称: label
数据类型: int64
- 名称: statement
数据类型: string
拆分:
- 名称: train
字节数: 13424738
样本数: 23928
下载大小: 5783764
数据集大小: 13424738
- 配置名称: id
特征:
- 名称: label
数据类型: int64
- 名称: statement
数据类型: string
拆分:
- 名称: train
字节数: 9249255
样本数: 23928
下载大小: 4507895
数据集大小: 9249255
- 配置名称: ig
特征:
- 名称: label
数据类型: int64
- 名称: statement
数据类型: string
拆分:
- 名称: train
字节数: 9412177
样本数: 23928
下载大小: 4632009
数据集大小: 9412177
- 配置名称: is
特征: []
拆分:
- 名称: train
字节数: 0
样本数: 0
下载大小: 324
数据集大小: 0
- 配置名称: kk
特征:
- 名称: label
数据类型: int64
- 名称: statement
数据类型: string
拆分:
- 名称: train
字节数: 11495748
样本数: 23928
下载大小: 5431977
数据集大小: 11495748
- 配置名称: ku
特征: []
拆分:
- 名称: train
字节数: 0
样本数: 0
下载大小: 324
数据集大小: 0
- 配置名称: ky
特征:
- 名称: label
数据类型: int64
- 名称: statement
数据类型: string
拆分:
- 名称: train
字节数: 11457298
样本数: 23928
下载大小: 5476066
数据集大小: 11457298
- 配置名称: la
特征: []
拆分:
- 名称: train
字节数: 0
样本数: 0
下载大小: 324
数据集大小: 0
- 配置名称: lb
特征:
- 名称: label
数据类型: int64
- 名称: statement
数据类型: string
拆分:
- 名称: train
字节数: 9529945
样本数: 23928
下载大小: 4770042
数据集大小: 9529945
- 配置名称: lo
特征:
- 名称: label
数据类型: int64
- 名称: statement
数据类型: string
拆分:
- 名称: train
字节数: 13894006
样本数: 23928
下载大小: 5990302
数据集大小: 13894006
- 配置名称: lv
特征:
- 名称: label
数据类型: int64
- 名称: statement
数据类型: string
拆分:
- 名称: train
字节数: 9307094
样本数: 23928
下载大小: 4829297
数据集大小: 9307094
- 配置名称: mt
特征:
- 名称: label
数据类型: int64
- 名称: statement
数据类型: string
拆分:
- 名称: train
字节数: 9398507
样本数: 23928
下载大小: 4792072
数据集大小: 9398507
- 配置名称: ny
特征:
- 名称: label
数据类型: int64
- 名称: statement
数据类型: string
拆分:
- 名称: train
字节数: 9288861
样本数: 23928
下载大小: 4603939
数据集大小: 9288861
- 配置名称: pt
特征:
- 名称: label
数据类型: int64
- 名称: statement
数据类型: string
拆分:
- 名称: train
字节数: 9348131
样本数: 23928
下载大小: 4708195
数据集大小: 9348131
- 配置名称: ru
特征:
- 名称: label
数据类型: int64
- 名称: statement
数据类型: string
拆分:
- 名称: train
字节数: 11866624
样本数: 23928
下载大小: 5804852
数据集大小: 11866624
- 配置名称: si
特征: []
拆分:
- 名称: train
字节数: 0
样本数: 0
下载大小: 324
数据集大小: 0
- 配置名称: sq
特征: []
拆分:
- 名称: train
字节数: 0
样本数: 0
下载大小: 324
数据集大小: 0
- 配置名称: sw
特征:
- 名称: label
数据类型: int64
- 名称: statement
数据类型: string
拆分:
- 名称: train
字节数: 9079584
样本数: 23928
下载大小: 4509926
数据集大小: 9079584
- 配置名称: tr
特征:
- 名称: label
数据类型: int64
- 名称: statement
数据类型: string
拆分:
- 名称: train
字节数: 9284450
样本数: 23928
下载大小: 4709134
数据集大小: 9284450
- 配置名称: vi
特征:
- 名称: label
数据类型: int64
- 名称: statement
数据类型: string
拆分:
- 名称: train
字节数: 10146700
样本数: 23928
下载大小: 4925278
数据集大小: 10146700
- 配置名称: yi
特征: []
拆分:
- 名称: train
字节数: 0
样本数: 0
下载大小: 324
数据集大小: 0
- 配置名称: zh
特征:
- 名称: label
数据类型: int64
- 名称: statement
数据类型: string
拆分:
- 名称: train
字节数: 8759021
样本数: 23928
下载大小: 4612879
数据集大小: 8759021
配置:
- 配置名称: af
数据文件:
- 拆分: train
路径: af/train-*
- 配置名称: ar
数据文件:
- 拆分: train
路径: ar/train-*
- 配置名称: de
数据文件:
- 拆分: train
路径: de/train-*
- 配置名称: en
数据文件:
- 拆分: train
路径: en/train-*
- 配置名称: es
数据文件:
- 拆分: train
路径: es/train-*
- 配置名称: fr
数据文件:
- 拆分: train
路径: fr/train-*
- 配置名称: ga
数据文件:
- 拆分: train
路径: ga/train-*
- 配置名称: gu
数据文件:
- 拆分: train
路径: gu/train-*
- 配置名称: ha
数据文件:
- 拆分: train
路径: ha/train-*
- 配置名称: hi
数据文件:
- 拆分: train
路径: hi/train-*
- 配置名称: id
数据文件:
- 拆分: train
路径: id/train-*
- 配置名称: ig
数据文件:
- 拆分: train
路径: ig/train-*
- 配置名称: is
数据文件:
- 拆分: train
路径: is/train-*
- 配置名称: kk
数据文件:
- 拆分: train
路径: kk/train-*
- 配置名称: ku
数据文件:
- 拆分: train
路径: ku/train-*
- 配置名称: ky
数据文件:
- 拆分: train
路径: ky/train-*
- 配置名称: la
数据文件:
- 拆分: train
路径: la/train-*
- 配置名称: lb
数据文件:
- 拆分: train
路径: lb/train-*
- 配置名称: lo
数据文件:
- 拆分: train
路径: lo/train-*
- 配置名称: lv
数据文件:
- 拆分: train
路径: lv/train-*
- 配置名称: mt
数据文件:
- 拆分: train
路径: mt/train-*
- 配置名称: ny
数据文件:
- 拆分: train
路径: ny/train-*
- 配置名称: pt
数据文件:
- 拆分: train
路径: pt/train-*
- 配置名称: ru
数据文件:
- 拆分: train
路径: ru/train-*
- 配置名称: si
数据文件:
- 拆分: train
路径: si/train-*
- 配置名称: sq
数据文件:
- 拆分: train
路径: sq/train-*
- 配置名称: sw
数据文件:
- 拆分: train
路径: sw/train-*
- 配置名称: tr
数据文件:
- 拆分: train
路径: tr/train-*
- 配置名称: vi
数据文件:
- 拆分: train
路径: vi/train-*
- 配置名称: yi
数据文件:
- 拆分: train
路径: yi/train-*
- 配置名称: zh
数据文件:
- 拆分: train
路径: zh/train-*
提供机构:
mbzuai-ugrip-statement-tuning



