classla/copa_hr

Name: classla/copa_hr
Creator: classla
Published: 2022-10-25 07:32:15
License: 暂无描述

Hugging Face2022-10-25 更新2024-03-04 收录

下载链接：

https://hf-mirror.com/datasets/classla/copa_hr

下载链接

链接失效反馈

官方服务：

资源简介：

COPA-HR数据集是克罗地亚语版本的COPA数据集，遵循XCOPA数据集的翻译方法。该数据集包含1000个前提，每个前提配有一个问题和两个选择，其中一个选择被标注为更合理的答案。数据集分为400个训练样本、100个验证样本和500个测试样本，包含premise, choice1, choice2, label, question, changed等特征。

提供机构：

classla

原始信息汇总

COPA-HR 数据集概述

基本信息

语言: 克罗地亚语 (hr)
许可证: CC-BY-SA-4.0
任务类别: 文本分类
任务ID: 自然语言推理
标签: 因果推理, 文本蕴含, 常识推理

数据集描述

来源: COPA-HR 数据集是英文 COPA 数据集的克罗地亚语翻译版本，遵循 XCOPA 数据集的翻译方法。
内容: 包含1000个前提，每个前提伴随一个问题和两个选择，以及一个标签指示哪个选择更合理。
示例: 前提 - "我的身体在草地上投下了影子"，问题 - "原因是什么？"，选择 - "太阳正在升起；草被割了"，标签 - "太阳正在升起"。

数据集结构

样本分布: 训练集400个样本，验证集100个样本，测试集500个样本。
特征: 包括 premise, choice1, choice2, label, question, changed (布尔值)。

引用信息

若在研究中使用此数据集，请引用以下文献:

@article{DBLP:journals/corr/abs-2104-09243, author = {Nikola Ljube\v{s}i{c} and Davor Lauc}, title = {BERTi{\{c}} - The Transformer Language Model for Bosnian, Croatian, Montenegrin and Serbian}, journal = {CoRR}, volume = {abs/2104.09243}, year = {2021}, url = {https://arxiv.org/abs/2104.09243}, archivePrefix = {arXiv}, }

5,000+

优质数据集

54 个

任务类型

进入经典数据集