Oztobuzz/Vi_ShareGPT4V

Name: Oztobuzz/Vi_ShareGPT4V
Creator: Oztobuzz
Published: 2024-04-12 16:29:09
License: 暂无描述

Hugging Face2024-04-12 更新2024-06-11 收录

下载链接：

https://hf-mirror.com/datasets/Oztobuzz/Vi_ShareGPT4V

下载链接

链接失效反馈

官方服务：

资源简介：

该数据集包含多个配置，每个配置下的数据文件路径、特征、分割信息、下载大小和数据集大小均有所不同。数据集的特征包括id、image、en_conversations和vi_conversations，其中en_conversations和vi_conversations是对话列表，包含from和value两个字段。数据集主要用于训练，每个配置的训练集大小和样本数量也有所不同。

提供机构：

Oztobuzz

原始信息汇总

数据集概述

配置信息

默认配置
- 数据文件路径：start_from_*/train-*
其他配置
- 共有14个特定配置，每个配置对应一个特定的数据文件路径，如：
  - start_from_000000019397/train-*
  - start_from_000000019542/train-*
  - start_from_000000020031/train-*
  - ...
  - start_from_000000208476/train-*

数据集特征

通用特征
- id: 数据类型为字符串
- image: 数据类型为字符串
- en_conversations: 列表类型，包含
  - from: 数据类型为字符串
  - value: 数据类型为字符串
- vi_conversations: 列表类型，包含
  - from: 数据类型为字符串
  - value: 数据类型为字符串

数据集大小

训练集大小
- 每个配置的训练集大小不同，例如：
  - start_from_000000019397: 训练集大小为47375字节，包含20个示例
  - start_from_000000019542: 训练集大小为231613字节，包含100个示例
  - start_from_000000020031: 训练集大小为45558字节，包含20个示例
  - ...
  - start_from_000000208476: 训练集大小为237917字节，包含100个示例
下载大小
- 每个配置的下载大小也不同，例如：
  - start_from_000000019397: 下载大小为28572字节
  - start_from_000000019542: 下载大小为116261字节
  - start_from_000000020031: 下载大小为30810字节
  - ...
  - start_from_000000208476: 下载大小为122859字节
数据集总大小
- 每个配置的数据集总大小等于其训练集大小，例如：
  - start_from_000000019397: 数据集总大小为47375字节
  - start_from_000000019542: 数据集总大小为231613字节
  - start_from_000000020031: 数据集总大小为45558字节
  - ...
  - start_from_000000208476: 数据集总大小为237917字节

搜集汇总

数据集介绍

以上内容由遇见数据集搜集并总结生成

5,000+

优质数据集

54 个

任务类型

进入经典数据集