kartikagg98/HINMIX_bn-en
收藏Hugging Face2024-03-25 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/kartikagg98/HINMIX_bn-en
下载链接
链接失效反馈官方服务:
资源简介:
---
dataset_info:
- config_name: lcsalign-bn
features:
- name: text
dtype: string
splits:
- name: valid
num_bytes: 184113
num_examples: 1001
- name: test
num_bytes: 183116
num_examples: 1001
download_size: 173769
dataset_size: 367229
- config_name: lcsalign-bnrom
features:
- name: text
dtype: string
splits:
- name: valid
num_bytes: 80652
num_examples: 1001
- name: test
num_bytes: 79698
num_examples: 1001
download_size: 118502
dataset_size: 160350
- config_name: lcsalign-en
features:
- name: text
dtype: string
splits:
- name: valid
num_bytes: 76019
num_examples: 1001
- name: test
num_bytes: 75359
num_examples: 1001
download_size: 113901
dataset_size: 151378
configs:
- config_name: lcsalign-bn
data_files:
- split: valid
path: lcsalign-bn/valid-*
- split: test
path: lcsalign-bn/test-*
- config_name: lcsalign-bnrom
data_files:
- split: valid
path: lcsalign-bnrom/valid-*
- split: test
path: lcsalign-bnrom/test-*
- config_name: lcsalign-en
data_files:
- split: valid
path: lcsalign-en/valid-*
- split: test
path: lcsalign-en/test-*
---
dataset_info:
- 配置名称: lcsalign-bn
特征:
- 名称: text
数据类型: string(字符串)
数据集划分:
- 名称: valid(验证集)
字节数: 184113
样本数量: 1001
- 名称: test(测试集)
字节数: 183116
样本数量: 1001
下载体积: 173769
数据集总体积: 367229
- 配置名称: lcsalign-bnrom
特征:
- 名称: text
数据类型: string(字符串)
数据集划分:
- 名称: valid(验证集)
字节数: 80652
样本数量: 1001
- 名称: test(测试集)
字节数: 79698
样本数量: 1001
下载体积: 118502
数据集总体积: 160350
- 配置名称: lcsalign-en
特征:
- 名称: text
数据类型: string(字符串)
数据集划分:
- 名称: valid(验证集)
字节数: 76019
样本数量: 1001
- 名称: test(测试集)
字节数: 75359
样本数量: 1001
下载体积: 113901
数据集总体积: 151378
配置项:
- 配置名称: lcsalign-bn
数据文件:
- 划分: valid(验证集)
路径: lcsalign-bn/valid-*
- 划分: test(测试集)
路径: lcsalign-bn/test-*
- 配置名称: lcsalign-bnrom
数据文件:
- 划分: valid(验证集)
路径: lcsalign-bnrom/valid-*
- 划分: test(测试集)
路径: lcsalign-bnrom/test-*
- 配置名称: lcsalign-en
数据文件:
- 划分: valid(验证集)
路径: lcsalign-en/valid-*
- 划分: test(测试集)
路径: lcsalign-en/test-*
提供机构:
kartikagg98
原始信息汇总
数据集概述
配置名称:lcsalign-bn
- 特征:
- 名称:text
- 数据类型:string
- 分割:
- valid
- 字节数:184113
- 示例数:1001
- test
- 字节数:183116
- 示例数:1001
- valid
- 下载大小:173769
- 数据集大小:367229
配置名称:lcsalign-bnrom
- 特征:
- 名称:text
- 数据类型:string
- 分割:
- valid
- 字节数:80652
- 示例数:1001
- test
- 字节数:79698
- 示例数:1001
- valid
- 下载大小:118502
- 数据集大小:160350
配置名称:lcsalign-en
- 特征:
- 名称:text
- 数据类型:string
- 分割:
- valid
- 字节数:76019
- 示例数:1001
- test
- 字节数:75359
- 示例数:1001
- valid
- 下载大小:113901
- 数据集大小:151378



