Oztobuzz/Vi_ShareGPT4V
收藏Hugging Face2024-04-12 更新2024-06-11 收录
下载链接:
https://hf-mirror.com/datasets/Oztobuzz/Vi_ShareGPT4V
下载链接
链接失效反馈官方服务:
资源简介:
该数据集包含多个配置,每个配置下的数据文件路径、特征、分割信息、下载大小和数据集大小均有所不同。数据集的特征包括id、image、en_conversations和vi_conversations,其中en_conversations和vi_conversations是对话列表,包含from和value两个字段。数据集主要用于训练,每个配置的训练集大小和样本数量也有所不同。
该数据集包含多个配置,每个配置下的数据文件路径、特征、分割信息、下载大小和数据集大小均有所不同。数据集的特征包括id、image、en_conversations和vi_conversations,其中en_conversations和vi_conversations是对话列表,包含from和value两个字段。数据集主要用于训练,每个配置的训练集大小和样本数量也有所不同。
提供机构:
Oztobuzz
原始信息汇总
数据集概述
配置信息
-
默认配置
- 数据文件路径:
start_from_*/train-*
- 数据文件路径:
-
其他配置
- 共有14个特定配置,每个配置对应一个特定的数据文件路径,如:
start_from_000000019397/train-*start_from_000000019542/train-*start_from_000000020031/train-*- ...
start_from_000000208476/train-*
- 共有14个特定配置,每个配置对应一个特定的数据文件路径,如:
数据集特征
- 通用特征
id: 数据类型为字符串image: 数据类型为字符串en_conversations: 列表类型,包含from: 数据类型为字符串value: 数据类型为字符串
vi_conversations: 列表类型,包含from: 数据类型为字符串value: 数据类型为字符串
数据集大小
-
训练集大小
- 每个配置的训练集大小不同,例如:
start_from_000000019397: 训练集大小为47375字节,包含20个示例start_from_000000019542: 训练集大小为231613字节,包含100个示例start_from_000000020031: 训练集大小为45558字节,包含20个示例- ...
start_from_000000208476: 训练集大小为237917字节,包含100个示例
- 每个配置的训练集大小不同,例如:
-
下载大小
- 每个配置的下载大小也不同,例如:
start_from_000000019397: 下载大小为28572字节start_from_000000019542: 下载大小为116261字节start_from_000000020031: 下载大小为30810字节- ...
start_from_000000208476: 下载大小为122859字节
- 每个配置的下载大小也不同,例如:
-
数据集总大小
- 每个配置的数据集总大小等于其训练集大小,例如:
start_from_000000019397: 数据集总大小为47375字节start_from_000000019542: 数据集总大小为231613字节start_from_000000020031: 数据集总大小为45558字节- ...
start_from_000000208476: 数据集总大小为237917字节
- 每个配置的数据集总大小等于其训练集大小,例如:
搜集汇总
数据集介绍

以上内容由遇见数据集搜集并总结生成



