five

strombergnlp/ans-stance

收藏
Hugging Face2022-10-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/strombergnlp/ans-stance
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为AraStance,主要用于阿拉伯语的立场检测任务。数据集包含阿拉伯语的新闻标题及其改写和损坏版本,任务是对这些标题进行三分类的立场预测。数据集包含三个字段:s1(声明/主题)、s2(需要分类的文本)和stance(立场标签)。数据集分为训练集、验证集和测试集,分别包含2652、755和379个实例。数据集的创建者未提供详细的注释过程、数据来源和语言生产者等信息。数据集的使用许可为Apache License, Version 2.0。
提供机构:
strombergnlp
原始信息汇总

数据集概述

数据集名称

  • 名称: AraStance
  • 别名: ans-stance

数据集属性

  • 语言: 阿拉伯语 (ar)
  • 许可证: Apache-2.0
  • 多语言性: 单语种
  • 大小: 1K<n<10K
  • 来源: 原始数据
  • 任务类别: 文本分类
  • 任务ID: 事实检查
  • 标签: 立场检测

数据集描述

  • 摘要: 该数据集包含阿拉伯语新闻标题及其改写和错误版本。立场预测版本是一个3类分类任务,数据包含三个字段:s1, s2, stance。
  • 语言: 阿拉伯语

数据集结构

  • 数据实例: 示例包括ID、s1(声明/主题)、s2(分类立场的文本)和stance(立场标签)。
  • 数据字段:
    • id: 字符串类型
    • s1: 字符串类型,表示声明/主题
    • s2: 字符串类型,用于分类其对源的立场
    • stance: 类别标签,表示文章对声明的立场
  • 数据分割:
    • 训练集: 2652个实例
    • 验证集: 755个实例
    • 测试集: 379个实例

数据集创建

  • 许可证信息: 数据集根据Apache许可证版本2.0分发
  • 贡献者: 感谢mkonxd添加此数据集

引用信息

@inproceedings{, title = "Stance Prediction and Claim Verification: An {A}rabic Perspective", author = "Khouja, Jude", booktitle = "Proceedings of the Third Workshop on Fact Extraction and {VER}ification ({FEVER})", year = "2020", address = "Seattle, USA", publisher = "Association for Computational Linguistics", }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作