strombergnlp/rustance
收藏数据集概述
数据集名称: RuStance
语言: 俄语 (bcp47:ru)
许可: CC-BY-4.0
数据集大小: 小于1000条 (n<1K)
数据来源: 原始数据
任务类别: 文本分类
具体任务:
- 事实核查
- 情感分类
数据集描述
数据集总结: RuStance是一个俄语立场预测数据集,包含对新闻文章的评论。每条记录包括评论文本、相关新闻文章的标题以及评论对文章的立场。
支持的任务和排行榜:
数据集结构
数据实例:
-
示例:
{ id: 0, text: Волки, волки!!, title: Минобороны обвинило «гражданского сотрудника» в публикации скриншота из игры вместо фото террористов. И показало новое «неоспоримое подтверждение», stance: 3 }
数据字段:
id: 字符串类型text: 表达立场的字符串title: 目标/话题的字符串stance: 立场类别标签,包括支持、否认、查询、评论
数据分割:
- 训练集: 958条句子
数据集创建
来源数据:
- 数据收集自2018年的俄罗斯新闻网站Meduza。
注释过程:
- 注释者为俄语母语者,具有IT教育背景,标记评论对新闻文章的支持、否认、查询或评论立场。
许可信息:
- 数据集根据CC-BY 4.0许可发布。
引用信息:
@inproceedings{lozhnikov2018stance, title={Stance prediction for russian: data and analysis}, author={Lozhnikov, Nikita and Derczynski, Leon and Mazzara, Manuel}, booktitle={International Conference in Software Engineering for Defence Applications}, pages={176--186}, year={2018}, organization={Springer} }



