five

classla/COPA-MK

收藏
Hugging Face2023-11-02 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/classla/COPA-MK
下载链接
链接失效反馈
官方服务:
资源简介:
COPA-MK数据集(马其顿语中的合理选择替代方案)是从英文COPA数据集翻译而来的,遵循了XCOPA数据集的翻译方法。该数据集包含1000个前提,每个前提配有一个问题和两个选择,其中一个选择被标记为更合理的答案。数据集被分为训练(400个实例)、验证(100个实例)和测试(500个实例)三个部分,分别存储在JSONL文件中。翻译质量得到了ReLDI Centre Belgrade的帮助确保。

The COPA-MK dataset (Macedonian Reasonable Choice Alternative) is translated from the English COPA dataset following the translation methodology of the XCOPA dataset. This dataset consists of 1000 premises, each paired with a question and two options, with one option annotated as the more plausible answer. The dataset is split into three subsets: training (400 instances), validation (100 instances), and test (500 instances), which are stored separately in JSONL files. The quality of the translation was ensured with the assistance of the ReLDI Centre Belgrade.
提供机构:
classla
原始信息汇总

COPA-MK 数据集

概述

COPA-MK 数据集(马其顿语中的合理替代选择)是根据 XCOPA 数据集翻译方法论英语 COPA 数据集 的翻译。

数据内容

  • 数据量:包含 1,000 个前提(例如:“我的身体在草地上投下影子”)。
  • 问题类型:每个前提对应一个问题(“原因是什么?”或“发生了什么结果?”)。
  • 选择项:每个问题有两个选择项(例如:“太阳正在升起”;“草被割了”)。
  • 标签:标记哪个选择项在给定注释者或翻译者的情况下更合理(例如:“太阳正在升起”)。

数据格式

数据集遵循与 克罗地亚 COPA-HR 数据集 相同的格式,分为训练(400 个实例)、验证(100 个实例)和测试(500 个实例)的 JSONL 文件。

数据文件

  • 训练集train.jsonl
  • 测试集test.jsonl
  • 验证集val.jsonl

作者

  • Ljubešić, Nikola
  • Koloski, Boshko
  • Zdravkovska, Kristina
  • Samardžić, Tanja

引用信息

@misc{11356/1687, title = {Choice of plausible alternatives dataset in Macedonian {COPA}-{MK}}, author = {Ljube{v s}i{c}, Nikola and Koloski, Boshko and Zdravkovska, Kristina and Kuzman, Taja}, url = {http://hdl.handle.net/11356/1687}, note = {Slovenian language resource repository {CLARIN}.{SI}}, copyright = {Creative Commons - Attribution-{ShareAlike} 4.0 International ({CC} {BY}-{SA} 4.0)}, issn = {2820-4042}, year = {2022} }

搜集汇总
数据集介绍
main_image_url
背景与挑战
背景概述
COPA-MK是一个马其顿语的因果常识推理数据集,包含1000个前提、问题和两个选择项,用于评估模型在因果推理任务上的表现。数据集分为训练集、验证集和测试集,格式为JSONL,适用于文本分类任务。
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作