NYTK/HuWNLI
收藏Hugging Face2025-01-16 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/NYTK/HuWNLI
下载链接
链接失效反馈官方服务:
资源简介:
HuWNLI数据集是Winograd模式任务的匈牙利语翻译版本,属于匈牙利语言理解评估基准工具包(HuLU)的一部分。该数据集通过翻译和人工校对原始英语Winograd模式创建,支持指代消解任务,并且是单语种数据集,仅包含匈牙利语数据。
提供机构:
NYTK
原始信息汇总
数据集概述
数据集名称
- 名称: HuWNLI
数据集描述
- 描述: HuWNLI是匈牙利语的Winograd模式数据集,格式化为推理任务。每个实例包含一个orig_id、一个id、两个句子和一个标签。
语言
- 语言: 匈牙利语(hu-HU)
许可
- 许可: 知识共享署名-相同方式共享4.0国际许可(cc-by-sa-4.0)
数据集结构
- 数据实例: 每个实例包含orig_id、id、sentence1、sentence2和label。
- 数据字段: 包括orig_id、id、sentence1、sentence2和label(1表示sentence2由sentence1推断出,0表示否则)。
- 数据分割: 训练集(562个实例)、开发集(59个实例)和测试集(134个实例)。
数据集创建
- 源数据: 数据是英语Winograd模式和GLUE的WNLI额外句对的翻译。
- 注释: 每个模式由语言学专家手动校对,并由语言学专家转换为nli格式。
使用数据集的考虑
- 平均人类性能: 测试集上的准确率为92.78%。
附加信息
- 许可证信息: HuWNLI根据知识共享署名-相同方式共享4.0国际许可发布。
- 引用信息: 使用此资源或其任何部分文档时,请参考Ligeti-Nagy等人的出版物。



