classla/copa_hr
收藏Hugging Face2022-10-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/classla/copa_hr
下载链接
链接失效反馈官方服务:
资源简介:
COPA-HR数据集是克罗地亚语版本的COPA数据集,遵循XCOPA数据集的翻译方法。该数据集包含1000个前提,每个前提配有一个问题和两个选择,其中一个选择被标注为更合理的答案。数据集分为400个训练样本、100个验证样本和500个测试样本,包含premise, choice1, choice2, label, question, changed等特征。
提供机构:
classla
原始信息汇总
COPA-HR 数据集概述
基本信息
- 语言: 克罗地亚语 (hr)
- 许可证: CC-BY-SA-4.0
- 任务类别: 文本分类
- 任务ID: 自然语言推理
- 标签: 因果推理, 文本蕴含, 常识推理
数据集描述
- 来源: COPA-HR 数据集是英文 COPA 数据集的克罗地亚语翻译版本,遵循 XCOPA 数据集的翻译方法。
- 内容: 包含1000个前提,每个前提伴随一个问题和两个选择,以及一个标签指示哪个选择更合理。
- 示例: 前提 - "我的身体在草地上投下了影子",问题 - "原因是什么?",选择 - "太阳正在升起;草被割了",标签 - "太阳正在升起"。
数据集结构
- 样本分布: 训练集400个样本,验证集100个样本,测试集500个样本。
- 特征: 包括 premise, choice1, choice2, label, question, changed (布尔值)。
引用信息
若在研究中使用此数据集,请引用以下文献:
@article{DBLP:journals/corr/abs-2104-09243, author = {Nikola Ljube\v{s}i{c} and Davor Lauc}, title = {BERTi{\{c}} - The Transformer Language Model for Bosnian, Croatian, Montenegrin and Serbian}, journal = {CoRR}, volume = {abs/2104.09243}, year = {2021}, url = {https://arxiv.org/abs/2104.09243}, archivePrefix = {arXiv}, }



