ad321/test-tweets
收藏Hugging Face2022-12-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ad321/test-tweets
下载链接
链接失效反馈官方服务:
资源简介:
该数据集名为tweeter-dataset-sent-analysis,主要用于文本分类任务,特别是情感分类。数据集包含英文推文,标注为正面或负面情感。数据集的创建者是通过众包方式进行的,且数据集是单语言的(英语)。数据集的规模在1M到10M之间。数据集的许可证为GPL-3.0。数据集的训练和评估配置包括标签映射、评估指标(准确率和F1分数)以及数据分割(训练集和验证集)。
This dataset, named tweeter-dataset-sent-analysis, is primarily designed for text classification tasks, specifically sentiment analysis. It comprises English tweets annotated with positive or negative sentiment labels. The dataset was created through crowdsourcing and is a monolingual English dataset. Its size ranges from 1 million to 10 million instances. The dataset is licensed under GPL-3.0. The training and evaluation configurations include label mapping, evaluation metrics (accuracy and F1-score), as well as data splitting into training and validation sets.
提供机构:
ad321
原始信息汇总
数据集概述
基本信息
- 名称: tweeter-dataset-sent-analysis
- 语言: 英语(en)
- 多语言性: 单语种
- 许可证: GPL-3.0
- 大小: 1M<n<10M
数据来源
- 来源类型: 原始数据
任务与标签
- 任务类别: 文本分类
- 具体任务: 情感分类
- 训练与评估指标:
- 标签字段: labels
- 评估指标:
- 准确率(Accuracy)
- F1分数(F1 binary)
数据划分
- 训练集: train
- 验证集: validation
数据集创建者
- 注释创建者: 众包
- 语言创建者: 众包



