five

nourheshamshaheen/tags_train_client_0

收藏
Hugging Face2024-07-02 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/nourheshamshaheen/tags_train_client_0
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集主要包含图像和文本消息数据。图像数据以图像格式存储,文本消息数据包括内容、角色和类型三个子字段,其中内容字段进一步细分为索引、文本和类型。数据集分为训练集,包含32,758个样本,总大小为1,872,335,431.541066字节。

This dataset primarily contains image and text message data. The image data is stored in image format, while the text message data includes three subfields: content, role, and type, with the content field further subdivided into index, text, and type. The dataset is divided into a training set, containing 32,758 samples, with a total size of 1,872,335,431.541066 bytes.
提供机构:
nourheshamshaheen
原始信息汇总

数据集概述

数据集信息

特征

  • image: 图像数据
  • messages: 列表类型
    • content: 列表类型
      • index: 整数类型
      • text: 字符串类型
      • type: 字符串类型
    • role: 字符串类型
  • type: 整数类型

数据分割

  • train: 训练集
    • num_bytes: 1872335431.541066 字节
    • num_examples: 32758 个样本

数据集大小

  • download_size: 1668963736 字节
  • dataset_size: 1872335431.541066 字节

配置

  • config_name: default
    • data_files:
      • split: train
      • path: data/train-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作