genta-tech/snli_indo
收藏Hugging Face2023-05-04 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/genta-tech/snli_indo
下载链接
链接失效反馈官方服务:
资源简介:
这是一个印尼语翻译版本的SNLI数据集,使用了Helsinki-NLP/EN-ID进行翻译。数据集包含前提、假设和标签三个特征,分为测试集、训练集和验证集三个部分。测试集包含10000个样本,训练集包含550152个样本,验证集包含10000个样本。总下载大小为20413774字节,数据集总大小为74636687字节。
这是一个印尼语翻译版本的SNLI数据集,使用了Helsinki-NLP/EN-ID进行翻译。数据集包含前提、假设和标签三个特征,分为测试集、训练集和验证集三个部分。测试集包含10000个样本,训练集包含550152个样本,验证集包含10000个样本。总下载大小为20413774字节,数据集总大小为74636687字节。
提供机构:
genta-tech
原始信息汇总
数据集概述
基本信息
- 许可证: CC-BY-4.0
- 任务类别: 文本分类
- 语言: 印尼语 (id)
- 数据集大小: 100K<n<1M
数据集特征
- 特征名称:
- 前提 (premise)
- 假设 (hyphothesis)
- 标签 (label)
- 数据类型:
- 前提: 字符串
- 假设: 字符串
- 标签: int64
数据集分割
- 训练集:
- 示例数量: 550152
- 字节数: 71884965
- 验证集:
- 示例数量: 10000
- 字节数: 1378057
- 测试集:
- 示例数量: 10000
- 字节数: 1373665
数据集大小
- 下载大小: 20413774 字节
- 数据集总大小: 74636687 字节



