five

ad321/test-tweets

收藏
Hugging Face2022-12-17 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/ad321/test-tweets
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集名为tweeter-dataset-sent-analysis,主要用于文本分类任务,特别是情感分类。数据集包含英文推文,标注为正面或负面情感。数据集的创建者是通过众包方式进行的,且数据集是单语言的(英语)。数据集的规模在1M到10M之间。数据集的许可证为GPL-3.0。数据集的训练和评估配置包括标签映射、评估指标(准确率和F1分数)以及数据分割(训练集和验证集)。

This dataset, named tweeter-dataset-sent-analysis, is primarily designed for text classification tasks, specifically sentiment analysis. It comprises English tweets annotated with positive or negative sentiment labels. The dataset was created through crowdsourcing and is a monolingual English dataset. Its size ranges from 1 million to 10 million instances. The dataset is licensed under GPL-3.0. The training and evaluation configurations include label mapping, evaluation metrics (accuracy and F1-score), as well as data splitting into training and validation sets.
提供机构:
ad321
原始信息汇总

数据集概述

基本信息

  • 名称: tweeter-dataset-sent-analysis
  • 语言: 英语(en)
  • 多语言性: 单语种
  • 许可证: GPL-3.0
  • 大小: 1M<n<10M

数据来源

  • 来源类型: 原始数据

任务与标签

  • 任务类别: 文本分类
  • 具体任务: 情感分类
  • 训练与评估指标:
    • 标签字段: labels
    • 评估指标:
      • 准确率(Accuracy)
      • F1分数(F1 binary)

数据划分

  • 训练集: train
  • 验证集: validation

数据集创建者

  • 注释创建者: 众包
  • 语言创建者: 众包
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作