five

davanstrien/test1

收藏
Hugging Face2023-07-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/davanstrien/test1
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集是一个用于文本分类任务的IMDB电影评论数据集,包含英文文本,由专家生成,主要用于情感分类任务。数据集分为训练集、测试集和无监督集,分别包含25000、25000和50000个样本。数据集的特征包括文本和标签,标签分为负面(neg)和正面(pos)两类。数据集的下载大小为84125825字节,总大小为133190346字节。
提供机构:
davanstrien
原始信息汇总

数据集概述

基本信息

  • 名称: IMDB
  • 语言: 英语
  • 许可证: 其他
  • 多语言性: 单语
  • 大小: 10K<n<100K
  • 来源数据集: imdb
  • 任务类别: 文本分类
  • 任务ID: 情感分类

数据集结构

  • 特征:
    • text: 字符串类型
    • label: 分类标签,包括 neg 和 pos
  • 配置名称: plain_text
  • 分割:
    • train: 25000个样本,33432835字节
    • test: 25000个样本,32650697字节
    • unsupervised: 50000个样本,67106814字节
  • 下载大小: 84125825字节
  • 数据集大小: 133190346字节

评估指标

  • 精度: Accuracy, F1 macro, F1 micro, F1 weighted
  • 精确度: Precision macro, Precision micro, Precision weighted
  • 召回率: Recall macro, Recall micro, Recall weighted
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作