garrettbaber/twitter-roberta-goemotions-binary-fear-classification
收藏Hugging Face2023-06-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/garrettbaber/twitter-roberta-goemotions-binary-fear-classification
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是用于项目twitter-goemotions-binary-fear-classification的AutoTrain处理数据集。数据集包含文本分类任务,主要关注情感分类,特别是恐惧情感的二元分类。数据集的样本包含多个特征字段,如文本内容、作者、子论坛、创建时间等,并且每个样本都标注了多种情感标签。数据集被分为训练集和验证集,分别包含168979和42246个样本。
该数据集是用于项目twitter-goemotions-binary-fear-classification的AutoTrain处理数据集。数据集包含文本分类任务,主要关注情感分类,特别是恐惧情感的二元分类。数据集的样本包含多个特征字段,如文本内容、作者、子论坛、创建时间等,并且每个样本都标注了多种情感标签。数据集被分为训练集和验证集,分别包含168979和42246个样本。
提供机构:
garrettbaber
原始信息汇总
数据集概述
数据集名称
- 项目名称: twitter-goemotions-binary-fear-classification
- 数据集名称: AutoTrain Dataset for project: twitter-goemotions-binary-fear-classification
任务类别
- 任务类别: text-classification
语言信息
- 语言代码: unk
数据集结构
数据实例
- 样本示例: 包含文本、特征ID、作者、子论坛、链接ID、父级ID、创建时间、评分者ID等多个字段。
- 目标字段: target,分类为二元类别(0或1)。
数据集字段
- 主要字段:
- text: 文本内容
- feat_id: 特征ID
- feat_author: 作者
- feat_subreddit: 子论坛
- feat_link_id: 链接ID
- feat_parent_id: 父级ID
- feat_created_utc: 创建时间(UTC)
- feat_rater_id: 评分者ID
- target: 目标类别(0或1)
数据集分割
- 分割详情:
- 训练集: 168979样本
- 验证集: 42246样本



