five

garrettbaber/twitter-roberta-goemotions-binary-fear-classification

收藏
Hugging Face2023-06-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/garrettbaber/twitter-roberta-goemotions-binary-fear-classification
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是用于项目twitter-goemotions-binary-fear-classification的AutoTrain处理数据集。数据集包含文本分类任务,主要关注情感分类,特别是恐惧情感的二元分类。数据集的样本包含多个特征字段,如文本内容、作者、子论坛、创建时间等,并且每个样本都标注了多种情感标签。数据集被分为训练集和验证集,分别包含168979和42246个样本。

该数据集是用于项目twitter-goemotions-binary-fear-classification的AutoTrain处理数据集。数据集包含文本分类任务,主要关注情感分类,特别是恐惧情感的二元分类。数据集的样本包含多个特征字段,如文本内容、作者、子论坛、创建时间等,并且每个样本都标注了多种情感标签。数据集被分为训练集和验证集,分别包含168979和42246个样本。
提供机构:
garrettbaber
原始信息汇总

数据集概述

数据集名称

  • 项目名称: twitter-goemotions-binary-fear-classification
  • 数据集名称: AutoTrain Dataset for project: twitter-goemotions-binary-fear-classification

任务类别

  • 任务类别: text-classification

语言信息

  • 语言代码: unk

数据集结构

数据实例
  • 样本示例: 包含文本、特征ID、作者、子论坛、链接ID、父级ID、创建时间、评分者ID等多个字段。
  • 目标字段: target,分类为二元类别(0或1)。
数据集字段
  • 主要字段:
    • text: 文本内容
    • feat_id: 特征ID
    • feat_author: 作者
    • feat_subreddit: 子论坛
    • feat_link_id: 链接ID
    • feat_parent_id: 父级ID
    • feat_created_utc: 创建时间(UTC)
    • feat_rater_id: 评分者ID
    • target: 目标类别(0或1)

数据集分割

  • 分割详情:
    • 训练集: 168979样本
    • 验证集: 42246样本
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作