strombergnlp/ans-stance
收藏Hugging Face2022-10-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/strombergnlp/ans-stance
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为AraStance,主要用于阿拉伯语的立场检测任务。数据集包含阿拉伯语的新闻标题及其改写和损坏版本,任务是对这些标题进行三分类的立场预测。数据集包含三个字段:s1(声明/主题)、s2(需要分类的文本)和stance(立场标签)。数据集分为训练集、验证集和测试集,分别包含2652、755和379个实例。数据集的创建者未提供详细的注释过程、数据来源和语言生产者等信息。数据集的使用许可为Apache License, Version 2.0。
提供机构:
strombergnlp
原始信息汇总
数据集概述
数据集名称
- 名称: AraStance
- 别名: ans-stance
数据集属性
- 语言: 阿拉伯语 (ar)
- 许可证: Apache-2.0
- 多语言性: 单语种
- 大小: 1K<n<10K
- 来源: 原始数据
- 任务类别: 文本分类
- 任务ID: 事实检查
- 标签: 立场检测
数据集描述
- 摘要: 该数据集包含阿拉伯语新闻标题及其改写和错误版本。立场预测版本是一个3类分类任务,数据包含三个字段:s1, s2, stance。
- 语言: 阿拉伯语
数据集结构
- 数据实例: 示例包括ID、s1(声明/主题)、s2(分类立场的文本)和stance(立场标签)。
- 数据字段:
id: 字符串类型s1: 字符串类型,表示声明/主题s2: 字符串类型,用于分类其对源的立场stance: 类别标签,表示文章对声明的立场
- 数据分割:
- 训练集: 2652个实例
- 验证集: 755个实例
- 测试集: 379个实例
数据集创建
- 许可证信息: 数据集根据Apache许可证版本2.0分发
- 贡献者: 感谢mkonxd添加此数据集
引用信息
@inproceedings{, title = "Stance Prediction and Claim Verification: An {A}rabic Perspective", author = "Khouja, Jude", booktitle = "Proceedings of the Third Workshop on Fact Extraction and {VER}ification ({FEVER})", year = "2020", address = "Seattle, USA", publisher = "Association for Computational Linguistics", }



