Name: mbzuai-ugrip-statement-tuning/flores_101_31_langs
Creator: mbzuai-ugrip-statement-tuning
Published: 2024-07-25 09:22:41
License: 暂无描述

下载链接：

https://hf-mirror.com/datasets/mbzuai-ugrip-statement-tuning/flores_101_31_langs

下载链接

链接失效反馈

官方服务：

资源简介：

--- dataset_info: - config_name: af features: - name: label dtype: int64 - name: statement dtype: string splits: - name: train num_bytes: 9191562 num_examples: 23928 download_size: 4587966 dataset_size: 9191562 - config_name: ar features: - name: label dtype: int64 - name: statement dtype: string splits: - name: train num_bytes: 10652881 num_examples: 23928 download_size: 5186405 dataset_size: 10652881 - config_name: de features: - name: label dtype: int64 - name: statement dtype: string splits: - name: train num_bytes: 9454467 num_examples: 23928 download_size: 4841701 dataset_size: 9454467 - config_name: en features: - name: label dtype: int64 - name: statement dtype: string splits: - name: train num_bytes: 8933740 num_examples: 23928 download_size: 4453158 dataset_size: 8933740 - config_name: es features: - name: label dtype: int64 - name: statement dtype: string splits: - name: train num_bytes: 9554575 num_examples: 23928 download_size: 4887854 dataset_size: 9554575 - config_name: fr features: - name: label dtype: int64 - name: statement dtype: string splits: - name: train num_bytes: 13555798 num_examples: 33898 download_size: 6913746 dataset_size: 13555798 - config_name: ga features: - name: label dtype: int64 - name: statement dtype: string splits: - name: train num_bytes: 9565994 num_examples: 23928 download_size: 4909131 dataset_size: 9565994 - config_name: gu features: - name: label dtype: int64 - name: statement dtype: string splits: - name: train num_bytes: 13322915 num_examples: 23928 download_size: 5780133 dataset_size: 13322915 - config_name: ha features: - name: label dtype: int64 - name: statement dtype: string splits: - name: train num_bytes: 9148474 num_examples: 23928 download_size: 4587902 dataset_size: 9148474 - config_name: hi features: - name: label dtype: int64 - name: statement dtype: string splits: - name: train num_bytes: 13424738 num_examples: 23928 download_size: 5783764 dataset_size: 13424738 - config_name: id features: - name: label dtype: int64 - name: statement dtype: string splits: - name: train num_bytes: 9249255 num_examples: 23928 download_size: 4507895 dataset_size: 9249255 - config_name: ig features: - name: label dtype: int64 - name: statement dtype: string splits: - name: train num_bytes: 9412177 num_examples: 23928 download_size: 4632009 dataset_size: 9412177 - config_name: is features: [] splits: - name: train num_bytes: 0 num_examples: 0 download_size: 324 dataset_size: 0 - config_name: kk features: - name: label dtype: int64 - name: statement dtype: string splits: - name: train num_bytes: 11495748 num_examples: 23928 download_size: 5431977 dataset_size: 11495748 - config_name: ku features: [] splits: - name: train num_bytes: 0 num_examples: 0 download_size: 324 dataset_size: 0 - config_name: ky features: - name: label dtype: int64 - name: statement dtype: string splits: - name: train num_bytes: 11457298 num_examples: 23928 download_size: 5476066 dataset_size: 11457298 - config_name: la features: [] splits: - name: train num_bytes: 0 num_examples: 0 download_size: 324 dataset_size: 0 - config_name: lb features: - name: label dtype: int64 - name: statement dtype: string splits: - name: train num_bytes: 9529945 num_examples: 23928 download_size: 4770042 dataset_size: 9529945 - config_name: lo features: - name: label dtype: int64 - name: statement dtype: string splits: - name: train num_bytes: 13894006 num_examples: 23928 download_size: 5990302 dataset_size: 13894006 - config_name: lv features: - name: label dtype: int64 - name: statement dtype: string splits: - name: train num_bytes: 9307094 num_examples: 23928 download_size: 4829297 dataset_size: 9307094 - config_name: mt features: - name: label dtype: int64 - name: statement dtype: string splits: - name: train num_bytes: 9398507 num_examples: 23928 download_size: 4792072 dataset_size: 9398507 - config_name: ny features: - name: label dtype: int64 - name: statement dtype: string splits: - name: train num_bytes: 9288861 num_examples: 23928 download_size: 4603939 dataset_size: 9288861 - config_name: pt features: - name: label dtype: int64 - name: statement dtype: string splits: - name: train num_bytes: 9348131 num_examples: 23928 download_size: 4708195 dataset_size: 9348131 - config_name: ru features: - name: label dtype: int64 - name: statement dtype: string splits: - name: train num_bytes: 11866624 num_examples: 23928 download_size: 5804852 dataset_size: 11866624 - config_name: si features: [] splits: - name: train num_bytes: 0 num_examples: 0 download_size: 324 dataset_size: 0 - config_name: sq features: [] splits: - name: train num_bytes: 0 num_examples: 0 download_size: 324 dataset_size: 0 - config_name: sw features: - name: label dtype: int64 - name: statement dtype: string splits: - name: train num_bytes: 9079584 num_examples: 23928 download_size: 4509926 dataset_size: 9079584 - config_name: tr features: - name: label dtype: int64 - name: statement dtype: string splits: - name: train num_bytes: 9284450 num_examples: 23928 download_size: 4709134 dataset_size: 9284450 - config_name: vi features: - name: label dtype: int64 - name: statement dtype: string splits: - name: train num_bytes: 10146700 num_examples: 23928 download_size: 4925278 dataset_size: 10146700 - config_name: yi features: [] splits: - name: train num_bytes: 0 num_examples: 0 download_size: 324 dataset_size: 0 - config_name: zh features: - name: label dtype: int64 - name: statement dtype: string splits: - name: train num_bytes: 8759021 num_examples: 23928 download_size: 4612879 dataset_size: 8759021 configs: - config_name: af data_files: - split: train path: af/train-* - config_name: ar data_files: - split: train path: ar/train-* - config_name: de data_files: - split: train path: de/train-* - config_name: en data_files: - split: train path: en/train-* - config_name: es data_files: - split: train path: es/train-* - config_name: fr data_files: - split: train path: fr/train-* - config_name: ga data_files: - split: train path: ga/train-* - config_name: gu data_files: - split: train path: gu/train-* - config_name: ha data_files: - split: train path: ha/train-* - config_name: hi data_files: - split: train path: hi/train-* - config_name: id data_files: - split: train path: id/train-* - config_name: ig data_files: - split: train path: ig/train-* - config_name: is data_files: - split: train path: is/train-* - config_name: kk data_files: - split: train path: kk/train-* - config_name: ku data_files: - split: train path: ku/train-* - config_name: ky data_files: - split: train path: ky/train-* - config_name: la data_files: - split: train path: la/train-* - config_name: lb data_files: - split: train path: lb/train-* - config_name: lo data_files: - split: train path: lo/train-* - config_name: lv data_files: - split: train path: lv/train-* - config_name: mt data_files: - split: train path: mt/train-* - config_name: ny data_files: - split: train path: ny/train-* - config_name: pt data_files: - split: train path: pt/train-* - config_name: ru data_files: - split: train path: ru/train-* - config_name: si data_files: - split: train path: si/train-* - config_name: sq data_files: - split: train path: sq/train-* - config_name: sw data_files: - split: train path: sw/train-* - config_name: tr data_files: - split: train path: tr/train-* - config_name: vi data_files: - split: train path: vi/train-* - config_name: yi data_files: - split: train path: yi/train-* - config_name: zh data_files: - split: train path: zh/train-* ---

数据集信息: - 配置名称: af 特征: - 名称: label 数据类型: int64 - 名称: statement 数据类型: string 拆分: - 名称: train 字节数: 9191562 样本数: 23928 下载大小: 4587966 数据集大小: 9191562 - 配置名称: ar 特征: - 名称: label 数据类型: int64 - 名称: statement 数据类型: string 拆分: - 名称: train 字节数: 10652881 样本数: 23928 下载大小: 5186405 数据集大小: 10652881 - 配置名称: de 特征: - 名称: label 数据类型: int64 - 名称: statement 数据类型: string 拆分: - 名称: train 字节数: 9454467 样本数: 23928 下载大小: 4841701 数据集大小: 9454467 - 配置名称: en 特征: - 名称: label 数据类型: int64 - 名称: statement 数据类型: string 拆分: - 名称: train 字节数: 8933740 样本数: 23928 下载大小: 4453158 数据集大小: 8933740 - 配置名称: es 特征: - 名称: label 数据类型: int64 - 名称: statement 数据类型: string 拆分: - 名称: train 字节数: 9554575 样本数: 23928 下载大小: 4887854 数据集大小: 9554575 - 配置名称: fr 特征: - 名称: label 数据类型: int64 - 名称: statement 数据类型: string 拆分: - 名称: train 字节数: 13555798 样本数: 33898 下载大小: 6913746 数据集大小: 13555798 - 配置名称: ga 特征: - 名称: label 数据类型: int64 - 名称: statement 数据类型: string 拆分: - 名称: train 字节数: 9565994 样本数: 23928 下载大小: 4909131 数据集大小: 9565994 - 配置名称: gu 特征: - 名称: label 数据类型: int64 - 名称: statement 数据类型: string 拆分: - 名称: train 字节数: 13322915 样本数: 23928 下载大小: 5780133 数据集大小: 13322915 - 配置名称: ha 特征: - 名称: label 数据类型: int64 - 名称: statement 数据类型: string 拆分: - 名称: train 字节数: 9148474 样本数: 23928 下载大小: 4587902 数据集大小: 9148474 - 配置名称: hi 特征: - 名称: label 数据类型: int64 - 名称: statement 数据类型: string 拆分: - 名称: train 字节数: 13424738 样本数: 23928 下载大小: 5783764 数据集大小: 13424738 - 配置名称: id 特征: - 名称: label 数据类型: int64 - 名称: statement 数据类型: string 拆分: - 名称: train 字节数: 9249255 样本数: 23928 下载大小: 4507895 数据集大小: 9249255 - 配置名称: ig 特征: - 名称: label 数据类型: int64 - 名称: statement 数据类型: string 拆分: - 名称: train 字节数: 9412177 样本数: 23928 下载大小: 4632009 数据集大小: 9412177 - 配置名称: is 特征: [] 拆分: - 名称: train 字节数: 0 样本数: 0 下载大小: 324 数据集大小: 0 - 配置名称: kk 特征: - 名称: label 数据类型: int64 - 名称: statement 数据类型: string 拆分: - 名称: train 字节数: 11495748 样本数: 23928 下载大小: 5431977 数据集大小: 11495748 - 配置名称: ku 特征: [] 拆分: - 名称: train 字节数: 0 样本数: 0 下载大小: 324 数据集大小: 0 - 配置名称: ky 特征: - 名称: label 数据类型: int64 - 名称: statement 数据类型: string 拆分: - 名称: train 字节数: 11457298 样本数: 23928 下载大小: 5476066 数据集大小: 11457298 - 配置名称: la 特征: [] 拆分: - 名称: train 字节数: 0 样本数: 0 下载大小: 324 数据集大小: 0 - 配置名称: lb 特征: - 名称: label 数据类型: int64 - 名称: statement 数据类型: string 拆分: - 名称: train 字节数: 9529945 样本数: 23928 下载大小: 4770042 数据集大小: 9529945 - 配置名称: lo 特征: - 名称: label 数据类型: int64 - 名称: statement 数据类型: string 拆分: - 名称: train 字节数: 13894006 样本数: 23928 下载大小: 5990302 数据集大小: 13894006 - 配置名称: lv 特征: - 名称: label 数据类型: int64 - 名称: statement 数据类型: string 拆分: - 名称: train 字节数: 9307094 样本数: 23928 下载大小: 4829297 数据集大小: 9307094 - 配置名称: mt 特征: - 名称: label 数据类型: int64 - 名称: statement 数据类型: string 拆分: - 名称: train 字节数: 9398507 样本数: 23928 下载大小: 4792072 数据集大小: 9398507 - 配置名称: ny 特征: - 名称: label 数据类型: int64 - 名称: statement 数据类型: string 拆分: - 名称: train 字节数: 9288861 样本数: 23928 下载大小: 4603939 数据集大小: 9288861 - 配置名称: pt 特征: - 名称: label 数据类型: int64 - 名称: statement 数据类型: string 拆分: - 名称: train 字节数: 9348131 样本数: 23928 下载大小: 4708195 数据集大小: 9348131 - 配置名称: ru 特征: - 名称: label 数据类型: int64 - 名称: statement 数据类型: string 拆分: - 名称: train 字节数: 11866624 样本数: 23928 下载大小: 5804852 数据集大小: 11866624 - 配置名称: si 特征: [] 拆分: - 名称: train 字节数: 0 样本数: 0 下载大小: 324 数据集大小: 0 - 配置名称: sq 特征: [] 拆分: - 名称: train 字节数: 0 样本数: 0 下载大小: 324 数据集大小: 0 - 配置名称: sw 特征: - 名称: label 数据类型: int64 - 名称: statement 数据类型: string 拆分: - 名称: train 字节数: 9079584 样本数: 23928 下载大小: 4509926 数据集大小: 9079584 - 配置名称: tr 特征: - 名称: label 数据类型: int64 - 名称: statement 数据类型: string 拆分: - 名称: train 字节数: 9284450 样本数: 23928 下载大小: 4709134 数据集大小: 9284450 - 配置名称: vi 特征: - 名称: label 数据类型: int64 - 名称: statement 数据类型: string 拆分: - 名称: train 字节数: 10146700 样本数: 23928 下载大小: 4925278 数据集大小: 10146700 - 配置名称: yi 特征: [] 拆分: - 名称: train 字节数: 0 样本数: 0 下载大小: 324 数据集大小: 0 - 配置名称: zh 特征: - 名称: label 数据类型: int64 - 名称: statement 数据类型: string 拆分: - 名称: train 字节数: 8759021 样本数: 23928 下载大小: 4612879 数据集大小: 8759021 配置: - 配置名称: af 数据文件: - 拆分: train 路径: af/train-* - 配置名称: ar 数据文件: - 拆分: train 路径: ar/train-* - 配置名称: de 数据文件: - 拆分: train 路径: de/train-* - 配置名称: en 数据文件: - 拆分: train 路径: en/train-* - 配置名称: es 数据文件: - 拆分: train 路径: es/train-* - 配置名称: fr 数据文件: - 拆分: train 路径: fr/train-* - 配置名称: ga 数据文件: - 拆分: train 路径: ga/train-* - 配置名称: gu 数据文件: - 拆分: train 路径: gu/train-* - 配置名称: ha 数据文件: - 拆分: train 路径: ha/train-* - 配置名称: hi 数据文件: - 拆分: train 路径: hi/train-* - 配置名称: id 数据文件: - 拆分: train 路径: id/train-* - 配置名称: ig 数据文件: - 拆分: train 路径: ig/train-* - 配置名称: is 数据文件: - 拆分: train 路径: is/train-* - 配置名称: kk 数据文件: - 拆分: train 路径: kk/train-* - 配置名称: ku 数据文件: - 拆分: train 路径: ku/train-* - 配置名称: ky 数据文件: - 拆分: train 路径: ky/train-* - 配置名称: la 数据文件: - 拆分: train 路径: la/train-* - 配置名称: lb 数据文件: - 拆分: train 路径: lb/train-* - 配置名称: lo 数据文件: - 拆分: train 路径: lo/train-* - 配置名称: lv 数据文件: - 拆分: train 路径: lv/train-* - 配置名称: mt 数据文件: - 拆分: train 路径: mt/train-* - 配置名称: ny 数据文件: - 拆分: train 路径: ny/train-* - 配置名称: pt 数据文件: - 拆分: train 路径: pt/train-* - 配置名称: ru 数据文件: - 拆分: train 路径: ru/train-* - 配置名称: si 数据文件: - 拆分: train 路径: si/train-* - 配置名称: sq 数据文件: - 拆分: train 路径: sq/train-* - 配置名称: sw 数据文件: - 拆分: train 路径: sw/train-* - 配置名称: tr 数据文件: - 拆分: train 路径: tr/train-* - 配置名称: vi 数据文件: - 拆分: train 路径: vi/train-* - 配置名称: yi 数据文件: - 拆分: train 路径: yi/train-* - 配置名称: zh 数据文件: - 拆分: train 路径: zh/train-*

应用场景：