five

shijianS01/mix-random-templates-llava-vsft-259k

收藏
Hugging Face2024-07-21 更新2024-07-22 收录
下载链接:
https://hf-mirror.com/datasets/shijianS01/mix-random-templates-llava-vsft-259k
下载链接
链接失效反馈
官方服务:
资源简介:
该数据集包含消息和图像两种主要数据类型。消息数据包括内容和角色两个子类型,其中内容进一步细分为索引、文本和类型。图像数据以图像格式存储。数据集分为训练集和测试集,训练集包含259,155个样本,测试集包含13,640个样本。数据集的下载大小为11,408,023,386字节,总大小为11,662,336,982.625字节。

The dataset contains two main types of data: messages and images. The message data includes two subtypes: content and role, with content further divided into index, text, and type. Image data is stored in image format. The dataset is divided into a training set and a test set, with the training set containing 259,155 samples and the test set containing 13,640 samples. The download size of the dataset is 11,408,023,386 bytes, and the total size is 11,662,336,982.625 bytes.
提供机构:
shijianS01
原始信息汇总

数据集概述

数据集结构

  • 特征:
    • messages:
      • content:
        • index: 数据类型为 int64
        • text: 数据类型为 string
        • type: 数据类型为 string
      • role: 数据类型为 string
    • images: 数据类型为 image

数据集划分

  • train:
    • 样本数量: 259155
    • 数据大小: 11080577044.625 字节
  • test:
    • 样本数量: 13640
    • 数据大小: 581759938.0 字节

数据集大小

  • 下载大小: 11408023386 字节
  • 总数据大小: 11662336982.625 字节

配置

  • config_name: default
    • 数据文件路径:
      • train: data/train-*
      • test: data/test-*
5,000+
优质数据集
54 个
任务类型
进入经典数据集
二维码
社区交流群

面向社区/商业的数据集话题

二维码
科研交流群

面向高校/科研机构的开源数据集话题

数据驱动未来

携手共赢发展

商业合作