five

mlburnham/PoliStance_Affect_QT

收藏
Hugging Face2024-07-20 更新2024-06-12 收录
下载链接:
https://hf-mirror.com/datasets/mlburnham/PoliStance_Affect_QT
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含手动标注的对政治家立场的引用推文。引用推文是一个特别具有挑战性的分类任务,因为它们包含来自多个作者的多种(通常是矛盾的)表达。数据集中的政治家Twitter句柄已被替换为他们的名字。立场标签包括:-1(反对)、0(中立)和1(支持)。测试集包含645个文档,其中约400个是从整个数据集中随机抽样的,其余的是关于训练或验证数据中未包含的6位政治家的推文。这些政治家包括:Ted Cruz、Hakeem Jeffries、Madison Cawthorn、Alexandria Ocasio-Cortez、Mitt Romney和Kyrsten Sinema。

This dataset contains quote tweets that have been hand labeled for stance towards a politician. Quote tweets are a particularly challenging classification task because they contain multiple (often contradictory) expressions from multiple authors. Twitter handles from politicians in the dataset have been replaced by their name. Stance labels include: -1 (Against), 0 (Neutral), and 1 (Support). The test set contains 645 documents, ~400 of which were randomly sampled from the entire data set and the rest are about 6 politicians not included in the training or validation data. These politicians are: Ted Cruz, Hakeem Jeffries, Madison Cawthorn, Alexandria Ocasio-Cortez, Mitt Romney, and Kyrsten Sinema.
提供机构:
mlburnham
原始信息汇总

数据集概述

数据集基本信息

  • 许可证: MIT
  • 配置:
    • 默认配置:包含训练、验证和测试数据集。
      • 训练数据路径: data/train-*
      • 验证数据路径: data/validation-*
      • 测试数据路径: data/test-*
  • 数据集大小:
    • 下载大小: 464770字节
    • 数据集总大小: 1451604字节

数据集特征

  • 特征名称
    • premise
    • target
    • stance
    • hypothesis
    • label
  • 特征类型:
    • premise: string
    • target: string
    • stance: int64
    • hypothesis: string
    • label: int64

数据集拆分

  • 训练集:
    • 数据量: 1935个样本
    • 大小: 869570字节
  • 验证集:
    • 数据量: 645个样本
    • 大小: 288178字节
  • 测试集:
    • 数据量: 645个样本
    • 大小: 293856字节

数据集标签和立场

  • 立场:
    • -1: Against
    • 0: Neutral
    • 1: Support
  • 标签:
    • 0: Entail
    • 1: Not Entail

测试集特殊说明

  • 包含645个文档,其中约400个随机抽样自整个数据集,其余关于6位未在训练或验证数据中出现的政治家。
  • 涉及的政治家:
    • Ted Cruz
    • Hakeem Jeffries
    • Madison Cawthorn
    • Alexandria Ocasio-Cortez
    • Mitt Romney
    • Kyrsten Sinema
搜集汇总
数据集介绍
main_image_url
以上内容由遇见数据集搜集并总结生成
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作