LabelStudio/IMDB_Sample_100
收藏Hugging Face2023-02-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/LabelStudio/IMDB_Sample_100
下载链接
链接失效反馈官方服务:
资源简介:
该数据集用于Label Studio的从零到一教程。数据集最初由Andrew Maas提供,包含超过100,000条评论。为了简化学习过程,Chris Hoge和Erin Mikail Staples通过编写脚本将数据集缩减到100条评论,并分为不同的批次以便于加载。
该数据集用于Label Studio的从零到一教程。数据集最初由Andrew Maas提供,包含超过100,000条评论。为了简化学习过程,Chris Hoge和Erin Mikail Staples通过编写脚本将数据集缩减到100条评论,并分为不同的批次以便于加载。
提供机构:
LabelStudio
原始信息汇总
数据集概述
数据集名称
- Zero to One: Label Studio Tutorial Dataset
数据集来源
- 由Andrew Maas提供,原始数据集包含超过100,000条评论。
数据集处理
- 数据集被缩减为100条评论,处理过程由Chris Hoge和Erin Mikail Staples执行。
- 处理步骤包括编写脚本,该脚本遍历目录结构以捕获数据和元数据作为数据行。
- 数据分为三个批次:
- 0 - 25,000: 标记的训练数据,包含正负情感混合。
- 25,001 - 75,000: 未标记的训练数据。
- 75,001 - 100,000: 标记的测试数据,包含正负情感混合。
- 每个批次的前100行被单独写入文件,以便于快速加载。
数据集大小
- n<1K



