davanstrien/test1
收藏Hugging Face2023-07-13 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/davanstrien/test1
下载链接
链接失效反馈官方服务:
资源简介:
该数据集是一个用于文本分类任务的IMDB电影评论数据集,包含英文文本,由专家生成,主要用于情感分类任务。数据集分为训练集、测试集和无监督集,分别包含25000、25000和50000个样本。数据集的特征包括文本和标签,标签分为负面(neg)和正面(pos)两类。数据集的下载大小为84125825字节,总大小为133190346字节。
提供机构:
davanstrien
原始信息汇总
数据集概述
基本信息
- 名称: IMDB
- 语言: 英语
- 许可证: 其他
- 多语言性: 单语
- 大小: 10K<n<100K
- 来源数据集: imdb
- 任务类别: 文本分类
- 任务ID: 情感分类
数据集结构
- 特征:
- text: 字符串类型
- label: 分类标签,包括 neg 和 pos
- 配置名称: plain_text
- 分割:
- train: 25000个样本,33432835字节
- test: 25000个样本,32650697字节
- unsupervised: 50000个样本,67106814字节
- 下载大小: 84125825字节
- 数据集大小: 133190346字节
评估指标
- 精度: Accuracy, F1 macro, F1 micro, F1 weighted
- 精确度: Precision macro, Precision micro, Precision weighted
- 召回率: Recall macro, Recall micro, Recall weighted



