five

LabelStudio/IMDB_Sample_100

收藏
Hugging Face2023-02-22 更新2024-03-04 收录
下载链接:
https://hf-mirror.com/datasets/LabelStudio/IMDB_Sample_100
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集用于Label Studio的从零到一教程。数据集最初由Andrew Maas提供,包含超过100,000条评论。为了简化学习过程,Chris Hoge和Erin Mikail Staples通过编写脚本将数据集缩减到100条评论,并分为不同的批次以便于加载。

该数据集用于Label Studio的从零到一教程。数据集最初由Andrew Maas提供,包含超过100,000条评论。为了简化学习过程,Chris Hoge和Erin Mikail Staples通过编写脚本将数据集缩减到100条评论,并分为不同的批次以便于加载。
提供机构:
LabelStudio
原始信息汇总

数据集概述

数据集名称

  • Zero to One: Label Studio Tutorial Dataset

数据集来源

  • 由Andrew Maas提供,原始数据集包含超过100,000条评论。

数据集处理

  • 数据集被缩减为100条评论,处理过程由Chris Hoge和Erin Mikail Staples执行。
  • 处理步骤包括编写脚本,该脚本遍历目录结构以捕获数据和元数据作为数据行。
  • 数据分为三个批次:
    • 0 - 25,000: 标记的训练数据,包含正负情感混合。
    • 25,001 - 75,000: 未标记的训练数据。
    • 75,001 - 100,000: 标记的测试数据,包含正负情感混合。
  • 每个批次的前100行被单独写入文件,以便于快速加载。

数据集大小

  • n<1K
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作