five

HiTZ/XCOPA-eu

收藏
Hugging Face2025-02-24 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/HiTZ/XCOPA-eu
下载链接
链接失效反馈
官方服务:
资源简介:
XCOPA-eu是COPA数据集的巴斯克语翻译版本,专注于前提与两个选择之间的因果关系。该数据集包含验证集和测试集,每个实例包括前提、两个可能的选择、问题类型(原因或结果)、标签、索引和是否更改的标记。适用于文本分类和多项选择题任务。

XCOPA-eu is the Basque translation of the COPA dataset, focusing on cause-effect relationships between a premise and two choices. The dataset includes validation and test splits, with each instance comprising a premise, two plausible alternatives, a question type (cause or effect), a label, an index, and a flag indicating whether the annotation has changed. It is suitable for text classification and multiple-choice question tasks.
提供机构:
HiTZ
原始信息汇总

数据集概述

名称: XCOPA-eu

语言: Basque (eu-ES)

许可: Creative Commons Attribution 4.0 International (CC BY 4.0)

多语言性: 单语

大小: 小于1K

任务类别:

  • 文本分类
  • 多选题

任务ID:

  • 自然语言推理
  • 多选题问答

数据集结构

数据实例

  • 字段:
    • premise (str): 前提
    • choice1 (str): 一个可能的选项
    • choice2 (str): 另一个可能的选项
    • question (str): causeeffect,分别表示前向/后向因果推理
    • label (int): 与前提通过question表示的关系相关的选项的索引;0表示choice11表示choice2
    • idx (int): 示例的索引
    • changed (bool): 相对于原始COPA版本的注释是否改变

数据分割

名称 验证 测试
默认 100 500

数据集创建

该数据集是英语COPA数据集的专业翻译,由HiTZ (UPV/EHU)在ILENIA项目框架内委托制作。

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作