five

argilla/twitter-coronavirus

收藏
Hugging Face2022-12-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/argilla/twitter-coronavirus
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集用于文本分类任务,特别是情感分析。数据来源于Twitter上的推文,并进行了手动标记。为了保护隐私,用户名和位置信息已被编码。数据集包含多个特征,如文本、输入、预测、预测代理等,并且提供了训练集的具体大小和示例数量。数据集的下载大小和总大小也有详细说明。
提供机构:
argilla
原始信息汇总

数据集卡片 "twitter-coronavirus"

数据集描述

数据集摘要

对数据进行文本分类。这些推文是从Twitter上抓取的,并进行了手动标记。为了保护隐私,名称和用户名已被编码。

列信息:

  1. 位置
  2. 发布时间
  3. 原始推文
  4. 标签
    • 极其负面
    • 负面
    • 中性
    • 正面
    • 极其正面

语言

英语

数据集信息

  • 语言: 英语
  • 许可: 未知
  • 大小类别: 10K<n<100K
  • 源数据集: 原始数据
  • 任务类别: 文本分类
  • 任务ID: 情感分类, 情感分析

特征

  • text: 字符串
  • inputs: 结构体
    • text: 字符串
  • prediction: 列表
    • label: 字符串
    • score: float64
  • prediction_agent: 字符串
  • annotation: null
  • annotation_agent: null
  • multi_label: 布尔值
  • explanation: null
  • id: 字符串
  • metadata: 结构体
    • location: 字符串
    • screen_name: int64
    • split: 字符串
    • user_name: int64
  • status: 字符串
  • event_timestamp: 时间戳[us]
  • metrics: 结构体
    • text_length: int64

拆分

  • train:
    • num_bytes: 25394534
    • num_examples: 44955

大小

  • download_size: 15712627
  • dataset_size: 25394534
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作