mlburnham/PoliStance_Affect_QT
收藏Hugging Face2024-07-20 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/mlburnham/PoliStance_Affect_QT
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含手动标注的对政治家立场的引用推文。引用推文是一个特别具有挑战性的分类任务,因为它们包含来自多个作者的多种(通常是矛盾的)表达。数据集中的政治家Twitter句柄已被替换为他们的名字。立场标签包括:-1(反对)、0(中立)和1(支持)。测试集包含645个文档,其中约400个是从整个数据集中随机抽样的,其余的是关于训练或验证数据中未包含的6位政治家的推文。这些政治家包括:Ted Cruz、Hakeem Jeffries、Madison Cawthorn、Alexandria Ocasio-Cortez、Mitt Romney和Kyrsten Sinema。
This dataset contains quote tweets that have been hand labeled for stance towards a politician. Quote tweets are a particularly challenging classification task because they contain multiple (often contradictory) expressions from multiple authors. Twitter handles from politicians in the dataset have been replaced by their name. Stance labels include: -1 (Against), 0 (Neutral), and 1 (Support). The test set contains 645 documents, ~400 of which were randomly sampled from the entire data set and the rest are about 6 politicians not included in the training or validation data. These politicians are: Ted Cruz, Hakeem Jeffries, Madison Cawthorn, Alexandria Ocasio-Cortez, Mitt Romney, and Kyrsten Sinema.
提供机构:
mlburnham
原始信息汇总
数据集概述
数据集基本信息
- 许可证: MIT
- 配置:
- 默认配置:包含训练、验证和测试数据集。
- 训练数据路径:
data/train-* - 验证数据路径:
data/validation-* - 测试数据路径:
data/test-*
- 训练数据路径:
- 默认配置:包含训练、验证和测试数据集。
- 数据集大小:
- 下载大小: 464770字节
- 数据集总大小: 1451604字节
数据集特征
- 特征名称:
- premise
- target
- stance
- hypothesis
- label
- 特征类型:
- premise: string
- target: string
- stance: int64
- hypothesis: string
- label: int64
数据集拆分
- 训练集:
- 数据量: 1935个样本
- 大小: 869570字节
- 验证集:
- 数据量: 645个样本
- 大小: 288178字节
- 测试集:
- 数据量: 645个样本
- 大小: 293856字节
数据集标签和立场
- 立场:
- -1: Against
- 0: Neutral
- 1: Support
- 标签:
- 0: Entail
- 1: Not Entail
测试集特殊说明
- 包含645个文档,其中约400个随机抽样自整个数据集,其余关于6位未在训练或验证数据中出现的政治家。
- 涉及的政治家:
- Ted Cruz
- Hakeem Jeffries
- Madison Cawthorn
- Alexandria Ocasio-Cortez
- Mitt Romney
- Kyrsten Sinema
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



