argilla/twitter-coronavirus
收藏Hugging Face2022-12-06 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/argilla/twitter-coronavirus
下载链接
链接失效反馈官方服务:
资源简介:
该数据集用于文本分类任务,特别是情感分析。数据来源于Twitter上的推文,并进行了手动标记。为了保护隐私,用户名和位置信息已被编码。数据集包含多个特征,如文本、输入、预测、预测代理等,并且提供了训练集的具体大小和示例数量。数据集的下载大小和总大小也有详细说明。
提供机构:
argilla
原始信息汇总
数据集卡片 "twitter-coronavirus"
数据集描述
数据集摘要
对数据进行文本分类。这些推文是从Twitter上抓取的,并进行了手动标记。为了保护隐私,名称和用户名已被编码。
列信息:
- 位置
- 发布时间
- 原始推文
- 标签
- 极其负面
- 负面
- 中性
- 正面
- 极其正面
语言
英语
数据集信息
- 语言: 英语
- 许可: 未知
- 大小类别: 10K<n<100K
- 源数据集: 原始数据
- 任务类别: 文本分类
- 任务ID: 情感分类, 情感分析
特征
- text: 字符串
- inputs: 结构体
- text: 字符串
- prediction: 列表
- label: 字符串
- score: float64
- prediction_agent: 字符串
- annotation: null
- annotation_agent: null
- multi_label: 布尔值
- explanation: null
- id: 字符串
- metadata: 结构体
- location: 字符串
- screen_name: int64
- split: 字符串
- user_name: int64
- status: 字符串
- event_timestamp: 时间戳[us]
- metrics: 结构体
- text_length: int64
拆分
- train:
- num_bytes: 25394534
- num_examples: 44955
大小
- download_size: 15712627
- dataset_size: 25394534



