shijianS01/mix-random-templates-llava-vsft-259k
收藏Hugging Face2024-07-21 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/shijianS01/mix-random-templates-llava-vsft-259k
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含消息和图像两种主要数据类型。消息数据包括内容和角色两个子类型,其中内容进一步细分为索引、文本和类型。图像数据以图像格式存储。数据集分为训练集和测试集,训练集包含259,155个样本,测试集包含13,640个样本。数据集的下载大小为11,408,023,386字节,总大小为11,662,336,982.625字节。
The dataset contains two main types of data: messages and images. The message data includes two subtypes: content and role, with content further divided into index, text, and type. Image data is stored in image format. The dataset is divided into a training set and a test set, with the training set containing 259,155 samples and the test set containing 13,640 samples. The download size of the dataset is 11,408,023,386 bytes, and the total size is 11,662,336,982.625 bytes.
提供机构:
shijianS01
原始信息汇总
数据集概述
数据集结构
- 特征:
- messages:
- content:
- index: 数据类型为
int64 - text: 数据类型为
string - type: 数据类型为
string
- index: 数据类型为
- role: 数据类型为
string
- content:
- images: 数据类型为
image
- messages:
数据集划分
- train:
- 样本数量: 259155
- 数据大小: 11080577044.625 字节
- test:
- 样本数量: 13640
- 数据大小: 581759938.0 字节
数据集大小
- 下载大小: 11408023386 字节
- 总数据大小: 11662336982.625 字节
配置
- config_name: default
- 数据文件路径:
- train: data/train-*
- test: data/test-*
- 数据文件路径:



