nourheshamshaheen/tags_train_client_0
收藏Hugging Face2024-07-02 更新2024-07-06 收录
下载链接:
https://hf-mirror.com/datasets/nourheshamshaheen/tags_train_client_0
下载链接
链接失效反馈官方服务:
资源简介:
该数据集主要包含图像和文本消息数据。图像数据以图像格式存储,文本消息数据包括内容、角色和类型三个子字段,其中内容字段进一步细分为索引、文本和类型。数据集分为训练集,包含32,758个样本,总大小为1,872,335,431.541066字节。
This dataset primarily contains image and text message data. The image data is stored in image format, while the text message data includes three subfields: content, role, and type, with the content field further subdivided into index, text, and type. The dataset is divided into a training set, containing 32,758 samples, with a total size of 1,872,335,431.541066 bytes.
提供机构:
nourheshamshaheen
原始信息汇总
数据集概述
数据集信息
特征
- image: 图像数据
- messages: 列表类型
- content: 列表类型
- index: 整数类型
- text: 字符串类型
- type: 字符串类型
- role: 字符串类型
- content: 列表类型
- type: 整数类型
数据分割
- train: 训练集
- num_bytes: 1872335431.541066 字节
- num_examples: 32758 个样本
数据集大小
- download_size: 1668963736 字节
- dataset_size: 1872335431.541066 字节
配置
- config_name: default
- data_files:
- split: train
- path: data/train-*
- data_files:



