five

NYTK/HuWNLI

收藏
Hugging Face2025-01-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/NYTK/HuWNLI
下载链接
链接失效反馈
官方服务:
资源简介:
HuWNLI数据集是Winograd模式任务的匈牙利语翻译版本,属于匈牙利语言理解评估基准工具包(HuLU)的一部分。该数据集通过翻译和人工校对原始英语Winograd模式创建,支持指代消解任务,并且是单语种数据集,仅包含匈牙利语数据。
提供机构:
NYTK
原始信息汇总

数据集概述

数据集名称

  • 名称: HuWNLI

数据集描述

  • 描述: HuWNLI是匈牙利语的Winograd模式数据集,格式化为推理任务。每个实例包含一个orig_id、一个id、两个句子和一个标签。

语言

  • 语言: 匈牙利语(hu-HU)

许可

  • 许可: 知识共享署名-相同方式共享4.0国际许可(cc-by-sa-4.0)

数据集结构

  • 数据实例: 每个实例包含orig_id、id、sentence1、sentence2和label。
  • 数据字段: 包括orig_id、id、sentence1、sentence2和label(1表示sentence2由sentence1推断出,0表示否则)。
  • 数据分割: 训练集(562个实例)、开发集(59个实例)和测试集(134个实例)。

数据集创建

  • 源数据: 数据是英语Winograd模式和GLUE的WNLI额外句对的翻译。
  • 注释: 每个模式由语言学专家手动校对,并由语言学专家转换为nli格式。

使用数据集的考虑

  • 平均人类性能: 测试集上的准确率为92.78%。

附加信息

  • 许可证信息: HuWNLI根据知识共享署名-相同方式共享4.0国际许可发布。
  • 引用信息: 使用此资源或其任何部分文档时,请参考Ligeti-Nagy等人的出版物。
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作