five

strombergnlp/rustance

收藏
Hugging Face2022-10-25 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/strombergnlp/rustance
下载链接
链接失效反馈
官方服务:
资源简介:
RuStance数据集是一个用于俄语立场预测的数据集,包含对新闻文章的评论。每条数据包括评论内容、新闻文章标题以及评论对文章的立场。立场检测是谣言和假新闻识别的关键组成部分,涉及提取作者对特定主张的立场。该数据集是首个针对俄语的公开立场预测数据集,并提供了基准模型。数据集来源于2018年从俄罗斯新闻网站Meduza抓取的评论,注释由俄语母语者完成。数据集适用于文本分类任务,特别是立场检测。

The RuStance dataset is a resource for Russian stance prediction, consisting of user comments on news articles. Each data entry contains the comment text, the title of the corresponding news article, and the stance of the comment towards the article. Stance detection is a critical component of rumor and misinformation identification, which involves extracting an author's stance toward a specific claim. This is the first publicly available stance prediction dataset for the Russian language, and benchmark models are provided alongside it. The dataset is sourced from comments scraped from the Russian news website Meduza in 2018, with annotations completed by native Russian speakers. The RuStance dataset is applicable to text classification tasks, particularly stance detection.
提供机构:
strombergnlp
原始信息汇总

数据集概述

数据集名称: RuStance

语言: 俄语 (bcp47:ru)

许可: CC-BY-4.0

数据集大小: 小于1000条 (n<1K)

数据来源: 原始数据

任务类别: 文本分类

具体任务:

  • 事实核查
  • 情感分类

数据集描述

数据集总结: RuStance是一个俄语立场预测数据集,包含对新闻文章的评论。每条记录包括评论文本、相关新闻文章的标题以及评论对文章的立场。

支持的任务和排行榜:

数据集结构

数据实例:

  • 示例:

    { id: 0, text: Волки, волки!!, title: Минобороны обвинило «гражданского сотрудника» в публикации скриншота из игры вместо фото террористов. И показало новое «неоспоримое подтверждение», stance: 3 }

数据字段:

  • id: 字符串类型
  • text: 表达立场的字符串
  • title: 目标/话题的字符串
  • stance: 立场类别标签,包括支持、否认、查询、评论

数据分割:

  • 训练集: 958条句子

数据集创建

来源数据:

  • 数据收集自2018年的俄罗斯新闻网站Meduza

注释过程:

  • 注释者为俄语母语者,具有IT教育背景,标记评论对新闻文章的支持、否认、查询或评论立场。

许可信息:

  • 数据集根据CC-BY 4.0许可发布。

引用信息:

@inproceedings{lozhnikov2018stance, title={Stance prediction for russian: data and analysis}, author={Lozhnikov, Nikita and Derczynski, Leon and Mazzara, Manuel}, booktitle={International Conference in Software Engineering for Defence Applications}, pages={176--186}, year={2018}, organization={Springer} }

5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作