derek-thomas/autotrain-data-i-bert-twitter-sentiment
收藏Hugging Face2023-02-23 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/derek-thomas/autotrain-data-i-bert-twitter-sentiment
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是为项目i-bert-twitter-sentiment自动处理的,用于文本分类任务。数据集的语言代码为unk,表示未知。数据集的每个实例包含文本和标签,标签分为三类:negative、neutral和positive。数据集分为训练集和验证集,分别包含36491和9124个样本。
提供机构:
derek-thomas
原始信息汇总
数据集概述
数据集描述
该数据集是为项目“i-bert-twitter-sentiment”自动处理的,用于文本分类任务。
语言
数据集的语言代码为unk。
数据集结构
数据实例
数据集中的样本示例如下:
json [ { "text": "Thanks\u002c Dave! Great show tonight. Sorry\u002c Craig. I\u2019ve got to get to bed. I\u2019ll catch you tomorrow. @user David Letterman", "target": 2 }, { "text": ""Ive been watching Gilmore Girls for the past 3 hours. Oops, happy Thursday!"", "target": 2 } ]
数据集字段
数据集包含以下字段:
- text: 字符串类型
- target: 分类标签,包括negative, neutral, positive三种类别
数据集分割
数据集被分割为训练集和验证集,具体分割情况如下:
| 分割名称 | 样本数量 |
|---|---|
| 训练集 | 36491 |
| 验证集 | 9124 |
该数据集适用于文本情感分析任务,通过分析推文文本内容来判断情感倾向。



