five

jalaluddin94/IndoJavaneseNLI

收藏
Hugging Face2023-08-03 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/jalaluddin94/IndoJavaneseNLI
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集基于IndoNLI生成,并使用MongoSilakan.net API翻译成东爪哇语“Ngoko”变体。支持的任务是自然语言推理(Natural Language Inference),数据语言为印尼语(Premise)和爪哇语(Hypothesis)。数据集包含训练、验证和测试三个部分,分别存储在train.csv、validation.csv和test.csv文件中。

该数据集基于IndoNLI生成,并使用MongoSilakan.net API翻译成东爪哇语“Ngoko”变体。支持的任务是自然语言推理(Natural Language Inference),数据语言为印尼语(Premise)和爪哇语(Hypothesis)。数据集包含训练、验证和测试三个部分,分别存储在train.csv、validation.csv和test.csv文件中。
提供机构:
jalaluddin94
原始信息汇总

数据集概述

数据集名称

IndoJavaneseNLI

数据集描述

该数据集基于IndoNLI,并通过MongoSilakan.net API翻译成东爪哇语“Ngoko”变体。

支持的任务

自然语言推理

语言

  • 前提语言:印度尼西亚语
  • 假设语言:爪哇语

数据集结构

  • 训练数据train.csv
  • 验证数据validation.csv
  • 测试数据test.csv

数据集创建

  • 源数据:基于IndoNLI
  • 源语言生产者:数据基于IndoNLI

数据文件配置

  • 默认配置default
  • 数据文件
    • 训练集:train.csv
    • 验证集:validation.csv
    • 测试集:test.csv
  • 分隔符

数据集大小

  • 大小范围:10万<n<100万
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作