jalaluddin94/IndoJavaneseNLI
收藏Hugging Face2023-08-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/jalaluddin94/IndoJavaneseNLI
下载链接
链接失效反馈官方服务:
资源简介:
该数据集基于IndoNLI生成,并使用MongoSilakan.net API翻译成东爪哇语“Ngoko”变体。支持的任务是自然语言推理(Natural Language Inference),数据语言为印尼语(Premise)和爪哇语(Hypothesis)。数据集包含训练、验证和测试三个部分,分别存储在train.csv、validation.csv和test.csv文件中。
该数据集基于IndoNLI生成,并使用MongoSilakan.net API翻译成东爪哇语“Ngoko”变体。支持的任务是自然语言推理(Natural Language Inference),数据语言为印尼语(Premise)和爪哇语(Hypothesis)。数据集包含训练、验证和测试三个部分,分别存储在train.csv、validation.csv和test.csv文件中。
提供机构:
jalaluddin94
原始信息汇总
数据集概述
数据集名称
IndoJavaneseNLI
数据集描述
该数据集基于IndoNLI,并通过MongoSilakan.net API翻译成东爪哇语“Ngoko”变体。
支持的任务
自然语言推理
语言
- 前提语言:印度尼西亚语
- 假设语言:爪哇语
数据集结构
- 训练数据:
train.csv - 验证数据:
validation.csv - 测试数据:
test.csv
数据集创建
- 源数据:基于IndoNLI
- 源语言生产者:数据基于IndoNLI
数据文件配置
- 默认配置:
default - 数据文件:
- 训练集:
train.csv - 验证集:
validation.csv - 测试集:
test.csv
- 训练集:
- 分隔符:
数据集大小
- 大小范围:10万<n<100万



